查看原文
其他

10本免费的机器学习和数据科学书籍

云栖社区 2019-03-29

听说,最近大家都开学了?不对,是学生们都已经开学了,开学第一件事是什么?发新书!发新书!发新书!好的,作为一个心地善良且热心服务程序员的小编,我决定给大家分享一波免费的机器学习和数据科学电子书!



1. 思考统计数据:程序员的概率和统计数据


作者:AllenB. Downey


Think Stats是面向Python程序员的概率和统计的介绍。Think Stats强调探索真实数据集和回答有趣问题的简单技术。该书使用美国国立卫生研究院的数据进行了案例研究及编程设计,本书的作者鼓励程序员使用真实数据集进行数据分析及编程,因为这样训练效果才能达到最好。


详情:

http://www.greenteapress.com/thinkstats/


2. 黑客的概率编程和贝叶斯方法


作者:CamDavidson-Pilon


本书介绍贝叶斯方法和概率编程,第一步是从计算/理解入手,第二步是讲其中运用到的数学观点。


贝叶斯方法是推理的自然方法,但在数学分析的章节背后作者为读者介绍了一些贝叶斯方法的有趣的故事。涉及概率论的贝叶斯推理的典型文本在本书的两到三章,接着就是贝叶斯推理。不幸的是,由于大多数贝叶斯模型的数学难以处理,读者只能看到简单的经过人工处理例子。这可以让用户对贝叶斯推理产生一些感觉,事实上,这些都是作者自己的先前意见。


详情:

http://camdavidsonpilon.github.io/Probabilistic-Programming-and-Bayesian-Methods-for-Hackers/


3. 理解机器学习:从理论到算法


作者:Shai Shalev-Shwartz和Shai Ben-David


机器学习是计算机科学发展最快的领域之一,具有广泛的应用前景。本教材的目的是以最基础的方式介绍机器学习及其提供的算法范例。本书提供了机器学习基础知识的理论解释以及将这些原理转化为实际算法的数学推导。在介绍了基础知识之后,本书还涵盖了以前教科书未解决的各种中心主题。其中包括讨论学习的计算复杂性以及凸性和稳定性的概念;重要的算法范例包括随机梯度下降,神经网络和结构化输出学习;还有一些新兴的理论概念,如PAC-Bayes方法和基于边界的压缩。


详情:

http://www.cs.huji.ac.il/~shais/UnderstandingMachineLearning/


4. 统计学的要素


作者:TrevorHastie,RobertTibshirani和JeromeFriedman


本书在一个共同的概念框架中阐述了这个领域的重要思想。虽然这种方法是统计学的,但其中重点的是概念而不是其所在领域。通过使用彩色图形给出了许多例子,它应该能够成为统计学家和任何对科学或工业数据挖掘感兴趣的人的宝贵资源。该书的覆盖范围很广,从监督学习(预测)到无监督学习。许多主题包括神经网络、支持向量机、分类树,这是所有此类数据中对该主题的第一次综合处理。


详情:

http://statweb.stanford.edu/~tibs/ElemStatLearn/printings/ESLII_print10.pdf


5. 统计学简介及其在R中的应用


作者:GarethJames,DanielaWitten,TrevorHastie和RobertTibshirani


本书介绍了统计学的方法。它针对的是高年级本科生,硕士生和博士生还有非数学科学的学生。该书还包含许多R语言的实例,并详细解释了如何在现实生活环境中实施各种方法,并且应该是实践数据科学家的宝贵资源。


详情:

http://www-bcf.usc.edu/~gareth/ISL/?



6. 数据科学的基础


作者:AvrimBlum,JohnHopcroft和RavindranKannan


虽然计算机科学的传统领域仍然非常重要,但未来越来越多的研究人员都希望参与使用计算机来理解和从应用程序中出现的大量数据中提取可用信息,而不仅仅是如何使计算机变得更加功能广泛。考虑到这一点,作者写了这本书,以涵盖在未来40年可能有用的理论,正如对自动机理论,机器学习算法和相关主题的理解,我觉得这对于未来几十年的理论都有影响。


详情:

https://www.cs.cornell.edu/jeh/book.pdf



7. 程序员数据挖掘指南:Numerati的古代艺术


作者:RonZacharski


这个指南遵循手把手教学的思想。我希望你能主动的完成练习并运行我提供的Python代码,而不是被动地阅读本书。并且我希望你能够积极参与尝试和编程数据挖掘技术。这本书算得上一个入门的教科书,它作为一系列相互依赖的微弱的积累,直到你完成本书时,你可能已经完全理解数据挖掘技术了。


详情:

http://guidetodatamining.com/


8. 大规模数据集的挖掘


作者:JureLeskovec,AnandRajaraman和JeffUllman


本书基于斯坦福计算机科学课程CS246:挖掘海量数据集和CS345A:数据挖掘。这本书与课程保持同步,而且这本书的难度是在本科计算机科学水平设计的,不需要太多的技能或者积累。为了支持更深入的探索,大多数章节都补充了进一步的阅读参考。


详情:http://mmds.org/


9. 深度学习


作者:IanGoodfellow,YoshuaBengio和AaronCourville


深度学习这本旨在帮助学生和从业者进入机器学习领域,特别是深度学习。该书的在线版本现已完成,并将在线免费提供。


详情:http://www.deeplearningbook.org/



10. 机器学习渴望


作者:AndrewNg


人工智能,机器学习和深度学习正在改变众多行业。但是建立一个机器学习系统,你需要思考下面这些问题:


  • 你能够收集更多的训练数据吗?

  • 你应该使用端到端的深度学习吗?

  • 你如何处理与你的测试集不匹配的训练集?

  • 还有其他一些细节问题。


从历史上看,学习如何制定这些“战略”决策的唯一方法是在研究生课程或公司中进行多年的学习训练。


详情:http://www.mlyearning.org/


以上为译文。

本文由阿里云云栖社区组织翻译。

文章原标题《10-free-must-read-books-machine-learning-data-science》,

作者:Matthew Mayo  译者:虎说八道,审校:。



end

读懂这篇文章,你的阿里技术面就可以过关了

老师,我把你的作文改了一下

“百变”Redis带你见识不同场景下的产品技术架构

AI从业者需要应用的10种深度学习方法

更多精彩

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存