查看原文
其他

Python数据分析:双色球的深度学习预测

2017-05-23 面包君 Python爱好者社区

(点击上方Python爱好者社区,可快速关注)

作者:面包君   数据分析侠知乎专栏:

https://zhuanlan.zhihu.com/dataman  


双色球是福利彩票的一种玩法,已经卖了有很多年。之前在支付宝上app可以买的,每天2块钱很有益身心健康,比LOL有积极意义。对于双色球这门游戏,刚开始买的时候是纯粹靠感觉,后来百度又看到了百度预测(虽然尼玛感觉一点都不准)。到底买双色球是纯靠运气,还是也有技术含量呢?



关于双色球的预测,有很多老彩民喜欢研究,有不少流派也看了一些。像黄金分割选号、尾数分布选号、相减排除等等方法就不一一枚举了,有兴趣的自行研究。


总之目标就是:


这里主要说下通过Python捞取双色球的历史数据、回归预测。

一、历史数据

双色球的历史数据URL:http://kaijiang.zhcw.com/zhcw/html/ssq/list_1.html

爬取数据这块主要就是用beautifulsoup就可以了。




写入到txt文件里,格式如:

#('2016-05-03', '09,12,24,28,29,30,02')

#('2016-05-01', '06,08,13,14,22,27,10')

#('2016-04-28', '03,08,13,14,15,30,04')

二、回归预测

主要是通过LR对每位数字的训练预测概率



整体上来说比random心理觉得靠谱些。

三、深度学习训练预测

时间序列上的RNN可能效果更好点,毕竟多了些记忆的特点。


在这里用RNN的变种LSTM进行训练预测,Python中有不少包可以直接调用来构建LSTM模型,比如pybrain, kears, tensorflow, cikit-neuralnetwork等。这里我们选用keras:https://keras.io/getting-started/sequential-model-guide/


具体的框架格式参考这里:https://github.com/CasiaFan/time_seires_prediction_using_lstm/blob/master/neural_network_run.py

至于还有很多其他方法待有空的时候再测试测试。

快报:面包君 6月20日在Hellobi Live直播 《互联网金融行业的大数据应用》

内容:1、互联网金融的发展历程  2、大数据在互联网金融的应用 3、 征信体系介绍 4、风控反作弊欺诈模型运用 5、互联网金融公司贷款授信 6、保险定价策略分析 7、量化投资应用 


 参加方式:阅读原文或扫码参加



关注公众号,“Python爱好者社区”,回复“爬虫”即可获取崔老师爬虫免费学习视频。


Python爱好者社区


为大家提供与Python相关的最新技术和资讯。


长按指纹 > 识别图中二维码 > 添加关注


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存