查看原文
其他

想用 Python 做数据分析?先玩玩这个再说

2016-08-05 Crossin Crossin的编程教室

数据分析是 Python 的一大应用领域。据我所知,本教室的读者中有不少学习 Python 就是为了在工作中能用它分析数据。这其中,又有相当一部分人是涉及金融相关行业,有从业人员,有学生,还有对此具有兴趣的爱好者。


那么,想要学习用 Python 做数据分析该从何入手?


既然是数据分析,首先,你得有数据。


今天就来介绍一个很好用的财经数据包:TuShare




直接摘录 TuShare 官网(tushare.org)上的介绍:


TuShare是一个免费、开源的python财经数据接口包。主要实现对股票等金融数据从数据采集、清洗加工到数据存储的过程,能够为金融分析人员提供快速、整洁、和多样的便于分析的数据,为他们在数据获取方面极大地减轻工作量,使他们更加专注于策略和模型的研究与实现上。


TuShare 数据格式使用 pandas DataFrame 类型,也可保存至 Excel 和 数据库。兼容 Python 2 和 3。


看起来很好很强大,关键还是免费且开源的。再来试下好不好用。


安装


TuShare 基于 Python,有两个主要依赖:pandaslxml。可以先分别安装这两个库,但我更推荐的是直接安装 Anaconda。对于要做数据分析和科学计算相关的同学来说,Anaconda 帮你一次性解决了几乎所有你可能用到的依赖库的安装,避免了某些库在不同平台上编译的问题。真的是谁用谁知道。


Anaconda 的下载安装这里就不多说了,本身不复杂,网上搜一下就出来了。


装好之后就可以直接通过 pip 安装 TuShare:


pip install tushare


还有其它安装方法可参考 如何安装 Python 的第三方模块


安装成功后,验证可以被 import。




功能


简单尝试几个基础功能:

1. 获取股票历史数据

get_hist_data


import tushare as ts

ts.get_hist_data('601688')




2. 获取股票实时行情

get_realtime_quotes


import tushare as ts

ts.get_realtime_quotes('000002')




除了股票,TuShare 还提供了多种数据,比如宏观经济数据:

3. 存款利率

get_deposit_rate


import tushare as ts

ts.get_deposit_rate()




甚至还有:

4. 电影票房

realtime_boxoffice


import tushare as ts

ts.realtime_boxoffice()



(暑期档的电影还真是让人无力吐槽……)


以上仅挑选了几个接口演示,具体调用参数和返回值字段说明,我就不做详细解释了,官网上都写的很清楚。


TuShare 的数据主要来源于网络,等于是提供了一个集中的接口,目前支持的数据包括:

  • 交易数据

  • 投资参考数据

  • 股票分类数据

  • 基本面数据

  • 宏观经济数据

  • 新闻事件数据

  • 龙虎榜数据

  • 银行间同业拆放利率

  • 电影票房


另外还引入了通联数据的开放平台数据接口,基本上满足全品类金融数据的需求。对于学习数据分析来说,更是非常好的数据来源。


示例


再用一小段简单的代码来演示下 TuShare 的使用。这里我将获取今年上证指数的日K信息,然后保存成 excel 文件,再画出每日的收盘指数的折线图。


import tushare as ts

import matplotlib.pyplot as plt


df=ts.get_hist_data('sh', start='2016-01-01')

df.to_excel('stock_sh.xlsx')

df.close.plot()

ax = plt.gca()

ax.invert_xaxis()

plt.show()





这里发现取到的数据和文档上显示的顺序是相反的,所以画图的时候多加了两行代码将x轴反向。



以上仅仅对 TuShare 做了一个极为简单的介绍,更详细的文档请自行去官网(toshare.org)上阅读,写得还是很清楚的。


当然最重要,是要亲手写一写代码。





近期文章推荐阅读:

用 Python 实现你的量化交易策略

极简 Github 上手教程

如何在 Python 中使用断点调试

Python爬虫:一些常用的爬虫技巧总结

Python 抓取网页乱码原因分析

一些常见的新手问题

如何直观地理解程序的运行过程?





Crossin的编程教室

微信ID:crossincode

论坛:http://bbs.crossincode.com

QQ群:498545096

点击左下角“阅读原文”,查看更多学习资源

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存