机器学习和数据科学领域必读的10本免费书籍
云栖君导读:在这个暑假,有兴趣的可以阅读一下这些免费的有关机器学习和数据科学的书籍,他们能给你打开一扇看清机器学习和数据科学的窗。
1. Python Data Science Handbook
作者:Jake VanderPlas
本书介绍了在Python中处理数据所必需的核心库,特别是IPython,NumPy,Pandas,Matplotlib,Scikit-Lean和相关的软件包。在此之前您需要掌握Python这种语言,如果您想快速掌握这门语言,可以参阅这个针对研究人员和科学家的Python语言快速入门的“Python的旋风之旅(A Whirlwind Tour of Python)”。
书籍地址:
https://github.com/jakevdp/PythonDataScienceHandbook
2. Neural Networks and Deep Learning
作者:Michael Nielsen
这是一本免费的在线书籍。通过这本书你会知道神经网络是一个美丽的生物启发式编程范例,使计算机可以从观测数据中学习。而深度学习则是一套强大的神经网络学习技术。
目前,神经网络和深度学习为图像识别、语音识别和自然语言处理(NLP)中的问题提供了很多效果不错的解决方案。通过这本书您将会知道更多神经网络和深度学习背后的核心概念。
书籍地址:
http://neuralnetworksanddeeplearning.com/
3. Think Bayes
作者:Allen B.Downey
这本书主要介绍了如何使用计算方法处理贝叶斯统计。
如果您想使用本书中的技能来学习其他技能,您需要知道如何编程。
贝叶斯统计是根据数学概念(如微积分)提出的,有关它的大多数书籍也都使用的是数学符号。本书使用Python代码而不是数学,因此“积分”变成了“总和”。这是书中的一个特色。
书籍地址:
http://greenteapress.com/wp/think-bayes/
4. Machine Learning & Big Data
作者:Karee Alkaseer
这本书背后的目的是为了让软件工程师在不依赖库的情况下可以轻松使用机器学习模型。大多数情况下,模型或技术背后的概念很简单、直观,但在细节或行话中会丢失。另外,一般情况下,现有的库可以解决手头的问题,但是有时候它们会用自己的方式抽象和隐藏基本概念,这就是它们被称为“黑盒子”的原因。这本书也尝试着将“黑盒子”里被抽象和隐藏的基本概念清晰化。它是一个还在进行中的作品,它的内容将慢慢的丰富。
书籍地址:
http://www.kareemalkaseer.com/books/ml
5. Satistical Learning with Sparsity:The Lasso and Generalizations
作者:Trevor Hastie,Robert Tibshirani,Martin Wainwright
在过去的十年中,计算和信息技术得到了迅猛发展。随着它的应用,在医学、生物学、金融和市场营销等领域中涌现出了大量的数据。本书在一个共同的概念框架下,阐述了这些领域中的一些重要观点。
书籍地址:
https://web.stanford.edu/~hastie/StatLearnSparsity/
6. Statistical inference for data science
作者:Brian Caffo
作为数据科学专业的一部分 ,本书是统计推理课程(Statistical Inference)的一本配套书籍。如果你没有上这门课,也可以配着YouTube上有关视频单独学习这本书。
本书旨在以低成本介绍统计推理这一重要领域,使得具有编程能力的学生将这些技能用到数据科学或统计学当中去。
书籍地址:
https://leanpub.com/LittleInferenceBook
7. Convex Optimization
作者:Stephen Boyd & Lieven Vandenberghe
这本书的主要内容是关于凸优化(convex optimization),这是一类特殊的数学优化问题,它包括最小二乘和线性规划问题。众所周知,最小二乘和线性规划问题有一个相当完整的理论,出现在各种应用中,并且可以非常有效地用数值求解。本书的基本观点是,对于较大类的凸优化问题也可以如此。
书籍地址:
http://stanford.edu/~boyd/cvxbook/
8. Natural Language Processing with Python
作者:Steven Bird & Ewan Klein & Edward Loper
本书基于Python编程语言和一个叫自然语言工具包(NLTK)的开源库写作而成的。“自然语言”是指用于人类日常交流的语言,与编程语言和数字符号等语言不同,自然语言在代代相传的过程中不断发展,并且很难用明确的规则来确定。为了让计算机更好地理解自然语言,我们开发运用了自然语言处理(NLP)。这本书就是有关自然语言处理(NLP)的书。
书籍地址:
https://www.nltk.org/book/
9. Automate the Boring Stuff with Python
作者:AI Sweigart
你是否有过为花费数小时为文件重命名或更新表格里的数百个单元格而烦躁的经历?在这本书中,你将会学到如何使用Python来轻松搞定这些问题。Python十分好上手,一旦掌握了编程的基础知识,就可以创建Python程序,就此轻松解决那些繁琐的事情。
书籍地址:
https://automatetheboringstuff.com/
10.Social Media Mining: An Introduction
作者:Reza Zafarani & Mohammad Ali Abbasi & Huan Liu
社交媒体在过去十年的发展已经彻底革新了个人互动和行业开展业务的方式。个人通过社交媒体互动、共享产生了大量的数据。
在这本书中,你将了解到社交媒体挖掘(Social Media Mining)整合了社交媒体,社交网络分析和数据挖掘,为学生、从业人员、研究人员等提供了一个方便而一致的平台。同时也将会了解到社交媒体挖掘(Social Media Mining)的潜力。
书籍地址:
http://dmml.asu.edu/smm/
本文由阿里云云栖社区组织翻译。
文章原标题《10 More Free Must-Read Books For Machine Learning and Data Science》
作者:Matthew Mayo
译者:乌拉乌拉,审校:袁虎。
文章为简译,更为详细的内容,点击左下角阅读原文查看。
阿里90后工程师利用ARM硬件特性开启安卓8终端“上帝模式”
更多精彩
点此查看原文!