查看原文
其他

【机器学习资料整理】(学习工具、学习视频、博客和文章推荐、ML相关算法参考、部分机器学习译文)

2016-05-26 十月秋枫 量化投资与机器学习

查看之前文章请点击右上角,关注并且查看历史消息,还可以在文章最后评论留言。谢谢您的支持!


如果连接点不开,请点击阅读原文。

书籍推荐

机器学习的书籍很多,下面推荐几本还不错的书籍。优于机器学习是一门跨领域的学科,所以在书籍上并非全是机器学习的书籍:

  • 1.《机器学习实战》Machine Learning in Action [美] Peter Harington 著。该书贯穿了10个最受欢迎的机器学习算法,提供了案例研究问题并用Python代码实例来解决。我本人比较喜欢这本书,因为里面的代码给了我很大的帮助,自己在学习机器学习算法的时候,理论上很多东西不太理解透,通过该书实践之后,在算法层面又有了进一步的提高。

  • 2.《统计学习方法》 李航著。该书比较详细地介绍了算法的原理,只从理论层面来研究算法。通过这本书和《机器学习实战》两本书相结合,一本讲理论,一本着手实践,加在一起会有事半功倍的效果。

  • 3.《数据挖掘概念与技术》 韩家炜著。该书介绍了数据挖掘的常用技术,比较详实,但本人觉得不太适合初学者,当时自己初学的时候看的就是这本书,结果最后很多地方理解的不是很好,后来通过《统计学习方法》和算法实践之后,再回头看《数据挖掘概念与技术》,感觉就轻松多了。

  • 4.《数学之美》 吴军著。本书可以当做业余书籍来看,可以在无聊的时候看看,不过里面讲的东西还是挺有用的。

  • 5.《Python科学计算》该书可以当做Python编程参考书籍,但前提是你喜欢使用Python,并爱上了它,不然这本书还是蛮贵的,我自己也是通过“研究生自由探索项目”才买的这本书,因为可以报销嘛。


学习工具

机器学习的tools很多,这里只列出几个参考工具。

  • .基于Python语言的库,里面涵盖了分类、聚类、回归的大部分算法,并且有常用的评估指标以及预处理数据的方法,是一个不错的学习库,强力推荐。附一篇博文:.

  • 语言,语言就是一门工具,R语言现在在商业界是用的最多的,在统计方面功能强大,而且也有封装好的算法库可以直接使用。附:.

  • ,是一个基于java开发的数据挖掘工具,可以尝试一下。它为用户提供了一系列据挖掘API、命令行和图形化用户接口。你可以准备数据、可视化、建立分类、进行回归分析、建立聚类模型,同时可以通过第三方插件执行其他算法。除了WEKA之外, 是Hadoop中为机器学习提供的一个很好的JAVA框架,你可以自行学习。如果你是机器学习和大数据学习的新手,那么坚持学习WEKA,并且全心全意地学习一个库。

  • Matlab,里面有很多的工具包,不过本人不怎么用过。参考:和。此外matlab中的可以很方便地解决线性和非线性问题,比如机器学习算法底层涉及的问题。如果你有工程背景,那么你可以由此入手。

  • :可能你并不想进行编程工作。你完全可以不通过代码,来使用 WEKA那样的工具。你通过使用BigMLS的服务来进行更加深入的工作。BigML通过Web页面,提供了机器学习的接口,因此你可以通过浏览器来建立模型。

  • 如果你使用Python,这里推荐一个IDE,,IDE版本就是Python的版本,自行选择!

下面给出一个比较图,具体想要学什么,还需自己抉择。


学习视频

首先推荐的便是Andrew Ng的斯坦福大学的机器学习课程。这套视频在网上有两个网址,国外和国内的都有,全程英语教学,内容很好,有时间建议你去听听:

  • 一个是国外的Coursera公开课,该课程在机器学习领域很火,是很多入门学者的首选。地址: CS229 course下载讲义和笔记](

  • 一个是国内的网易公开课,链接地址:

下面是一个机器学习视频库,由加州理工学院(Caltech)出品。

  • 机器学习视频库,地址:

其它的视频库

  • ,这个网站的视频比较多。你可以找出比较感兴趣的资源,然后深入学习。

机器学习最近在国内比较火,许多培训机构都相应的开了该门课程,如果想要听中文教程的,可以去网上搜索下,这里就不给培训机构打广告了。


博客和文章推荐

大牛们的博客,会让你感到兴奋,让你觉得你不是一个人在奋斗,让你时刻记住你的前方已经有很多的学者正在等着你,你要加油。他们的经验会让我们少走些冤枉路,能让我们在他们的基础上进一步理解。下面推荐几个我所知道的或者说我了解到的几位牛人博客和几篇文章:

  • pluskid,真名张弛原,一位技术大牛,毕业于浙江大学,后来出国深造。他的博文质量非常高,深入浅出,其SVM三层境界的讲解让人茅塞顿开,应该给了很多人启发吧,很值得学习。现在的博客网址:,原博客网址:

  • Rachel Zhang,真名张睿卿,很有气质的一位软妹纸,目前是百度深度学习实验室研发工程师,在CSDN中的博客人气绝对屈指可数,算是IT界的一位女中豪杰。博客网址:

  • July,对算法研究独具一格,目前是七月在线科技创始人兼CEO。博客网址:

  • Jason,一位国外机器学习爱好者,其博客内容详实,多篇文章被国内机器学习者翻译。博客网址:

  • 一个国外很好的机器学习博客,里面介绍了详细的算法知识,很全面,从感知机、神经网络、决策树、SVM、Adaboost到随机森林、Deep Learning.网址:

  • 一篇涵盖许多机器学习资料的文章:

  • Edwin Chen ,机器学习爱好者,博客内容涵盖数学、机器学习和数据科学。分享其中一篇博文:

  • 一篇以前的博文:,有时间好好阅读阅读,对你绝对有帮助。

  • ,一篇很有帮助的机器学习文章,里面包括了特征选择与模型的简化。

  • 机器学习规则。该文章比较老,2006年发布的,作者是Tom Mitchell,但很有参考价值,其中定义了机器学习的规则。Mitchell在说服CMU总裁为一个百年内都存在的问题建立一个独立的机器学习部门时,也用到了这本书中的观点。希望能对你也有所帮助。

  • 分享一个网站:。


国外网站

如果你想搜索比较新颖的机器学习资料或是文章,可以到以下网站中搜索,里面不仅包括了机器学习的内容,还有许多其它相关领域内容,如数据科学和云计算等。

  • InfoWord:

  • Kdnuggets:

  • Datasciencecentral:

  • Datascienceplus:


数据科学竞赛

关于数据分析的竞赛,国内国外都有,下面推荐几个比较火的竞赛网站 :

  • Kaggle比赛,网址:

  • DataCastle比赛,网站:

  • 2015年有个【2015天池大数据竞赛】


ML相关算法参考

  • 决策树-参考:

  • SVM支持向量机-参考:

  • Adaboost-参考:

  • Random Forest-参考:

  • 朴素贝叶斯算法-参考:

  • 人工神经网络-参考:

  • Apriori算法-参考地址:

  • K最近邻算法-参考:

  • 梯度树提升GTB算法-参考:

  • K-means聚类-参考:

  • 组合算法总结-参考:

  • EM期望最大算法-参考:

  • Logistic回归-参考:

  • HMM隐马尔可夫模型,参考:

  • 条件随机场,参考:

  • 随机森林和GBDT,参考:

  • 特征选择和特征提取,参考:

  • 梯度下降法,参考:

  • 牛顿法,参考:

  • 线性判别分析,参考:

  • 深度学习-


译文

  • 2015-09-14 

  • 2015-09-10 

  • 2015-08-31 

  • 2015-08-27 

  • 2015-08-20 

  • 2015-08-11 

  • 2015-08-03 

  • 2015-07-15 

  • 2015-07-13 

下面是相关译者的译文,仅供参考:

  • 2015-09-16 

  • 2015-09-11 

  • 2015-09-10 


【过往文章】

0.【重!磅!干!货!】互联网金融之量化投资深度文本挖掘——附源码文档

1.【机器学习课程】深度学习与神经网络系列之绪论介绍

2.【Python机器学习】系列之线性回归篇【深度详细】

3.多因子策略系列(一)——因子回溯测试的总体框架

4.Python机器学习:数据拟合与广义线性回归

5.【分级基金】之分级A的隐含收益率研究分析

6.【精华干货】Quant 需要哪些 Python 知识

7.【干货】量化投资国内外很棒的论坛网站

8.朴素贝叶斯模型(NBM)详解与在Matlab和Python里的具体应用

9.机器学习的前期入门汇总

10.【深度原创研究】分级基金下折全攻略(一)

11.【深度原创研究】分级基金下折全攻略(二)

12.【知识食粮】最新华尔街牛人必读书籍排行

13.通过 MATLAB 处理大数据

14.【扎实资料干货分享】Python、研究报告、计量经济学、投资书籍、R语言等!(Book+Video)

15.机器学习在统计套利中的应用

16.量化投资修行之路

17.统计套利在股指期货跨期套利中的应用:基于协整方法的估计

18.股指期货跨品种套利交易

19.沪港通股票统计套利:基于BP神经网络

20.机器学习到底在量化金融里哪些方面有应用?

21.【Matlab机器学习】之图像识别

22.【干货分享】Python数据结构与算法设计总结篇

23.基于Python的股票数据接口调用代码实例

24.基于Python爬取腾讯网的最热评论代码实例

25.卷积神经网络反向传播推导

26.深度学习项目


量化投资与机器学习

知识、能力、深度、专业

勤奋、天赋、耐得住寂寞


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存