一份完整的数据分析师成长书单
The following article is from DC黑板报 Author 逗汁儿
“与数据同行”开通了微信群,分为数据仓库、数据分析、产品经理、数据治理及数据建模五大专业,现已汇聚了4000位小伙伴了,加傅一平为微信好友(微信号:frank61822702)申请入群,让我们共建一个数据社区。
正文开始
如何快速成为数据分析师?
数据分析是一门专业且跨越多个领域的学科,想要成为任何一名数据分析师就需要掌握相关的专业技能。
然而许多跨入这个行业或者说已经在这个行业工作的人是半路出家,或者是纯粹的小白,没有基础或基础不牢,想要学习却没有头绪。
但大家都有一个共同点,即迫切的想要快速迈入数据分析师这个门槛,在短时间内高效的掌握数据分析的知识和并找到一份相关的工作。
这个时候学习资源就尤为重要了,如果有好书作为参考,对数据分析能力的成长更有帮助。
下面推荐的书单,是一个相对完整的入门学习体系,内容较多,建议大家采取阶段性学习。
01
基础-统计学
统计学是数据分析方法论中的核心基础,在数据分析的方法模型中,很大程度上都来源于统计学的方法,所以掌握统计原理是必须的。
《数学之美》
此书名为数学之美,实为信息技术(自然语言处理)中的数学原理(统计语言模型)之美。
更深刻地理解大学所学的线性代数、概率论与数理统计和应该学而没学的随机过程、图论、机器学习的应用意义。
书中将高深的数学原理讲得更加通俗易懂,让非专业读者也能领略数学的魅力。
读者说,读了“数学之美”,才发现大学时学的数学知识,原来都如此亲切,并且栩栩如生,才发现自然语言和信息处理这么有趣。
《深入浅出统计学》
《深入浅出统计学》具有“深入浅出”系列的一贯特色,提供符合直觉的理解方式,让统计理论的学习既有趣又自然。
从应对考试到解决实际问题,无论你是学生还是数据分析师,都能从中受益。
这些是之后可以直接应用到你的数据分析项目中去的一些方法。从统计向机器学习深入和过渡,对目前目前的统计学习方法有全面的介绍。
02
入门-数据分析
这一部分主要是了解数据分析和数据挖掘的方法、工具等理论上的东西,是为后续的数据分析实战打好基础。
此书最大的优点就是非常的简明易懂,还给你填了很多统计方面的坑,让没有统计知识的你不至于一脸懵逼。
数据分析基本步骤、实验方法、最优化方法、假设检验方法、误差处理、相关数据库、数据整理技巧等相关知识都有介绍。
《数据挖掘导论》
这绝对是你进入数据分析和数据挖掘领域的核心书籍,也是数据挖掘的入门经典。
书中对数据、分类、关联分析、聚类和异常检测作出了细致入微的阐述。还有一些常用的数据挖掘算法和伪代码,可以作为延伸学习。
当然数据挖掘的东西更多的是要去理解,而不是记忆,理解理论背后的原理会让你在后续的实战中能够更加得心应手。
《数据挖掘概念与技术》
这本书的定位和《数据挖掘导论》的定位比较相似,都是在数据挖掘、分析技术的问题上的探讨。
这本书虽然名为data mining,但其实思想都是machine learning的东西,这也可以是一个了解机器学习的不错的切入点。
03
实战-数据技术
那么接下来就需要上手实践了,做数据分析的工具有很多,比如大家常见的excel,还有python、R等编程语言,这里首推python。
《利用python进行数据分析》
此书绝对是计算科学和数据分析经典中的经典,强大的地方在于,书中不仅建立了一个完善的python分析方法论体系,还有大量具体的实践建议,以及大量综合应用方法。
将学会如何利用各种Python库(包括NumPy、pandas、matplotlib以及IPython等)高效地解决各式各样的数据分析问题,所以这将是你真正意义上数据分析实战的开始。
《python核心编程(第二版)》
要用python进行数据分析,学习python这门语言是必须的了,这本书就是python编程的经典。
尤其是每一小节后面的核心笔记,讲解了一些有用的编程技巧和知识,知识点非常细致,你可以学到很多以前不知道的编程知识。
当然这本书用来扫盲可能有一定的难度,可能更适合进阶,让你打扎实python 的基础。
《python数据分析与挖掘实战》
通过这本书,你完全可以阅读过程中,充分利用随书配套的案例建模数据,借助相关的数据挖掘建模工具,通过自己进行上机实战掌握Python的数据分析。
《深入浅出SQL》
非常浅显易懂, 图表间的注释是本书精华所在。细致到几近啰嗦,小白都可以轻松看懂,可能是因为数据库技术本身难度并不是特别大。
作为入门的书相当的不错,有辅助理解的讲解和例子,同时有有练习题加深记忆。
当然书的内容略多,如果你是需要快速学习的话,在你已经理解之后就不必过度扣细节,毕竟你可能需要更多在实战中应用。
《高性能mysql》
分享MySQL实用经验的图书,它不但可以帮助MySQL初学者提高使用技巧,更为有经验的MySQL DBA指出了开发高性能MySQL应用的途径。
书中的知识点非常全面,但可能学习成本略高,并非全要掌握,作为遇到困难时的词典查阅也不错。
04
进阶-机器学习
那么机器学习这部分一定是提升你整个思维方式和数据分析水平的杀器。你将会有目的地去选择合适的方法应用在不同的场景,分析水平得以提升。
《机器学习》
这确实是机器学习里优秀的中文书籍了,大牛周志华将机器学习中的模型方法,应用场景、理论推导、优化过程、算法等进行了全面而细致的讲解,堆积初级的宏观学习机器学习分析方法可以说是既简洁而又实用。
《机器学习实战》
这本书会让你意识到那些被吹捧得出神入化的分类算法,竟然实现起来如此简单;
那些看似高深的数学理论,其实一句话就能道明其本质;一切复杂的事物,出发点都是非常简单的想法。
《集体智慧编程》
以机器学习与计算统计为主题背景,述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论。
想把 paper 上的公式转变为可以运行的代码,这是件考验功力的事情这本书就是是修炼此种功力的武林秘笈之一。
最显著的特点是,实战性极强!针对每个算法,他从头到尾演示了一个完整的实现过程:从获取数据,组织存储,到算法实现,加载运算,再到最后的结果的分析利用。
05
应用-商业数据分析
此时许多小伙伴可能已经开始从事数据分析师的工作,而数据分析这项技能所能进入的行业范围广,涉及的领域也非常多,你可以根据自己的业务方向来进行书籍的选择,下面推荐的则是比较通用的。
《精益数据分析》
这本书里讲解了创业公司该如何确定指标体系,如何用数据指导产品和运营。本书还针对电商、媒体、SaaS、双边市场、UGC等,列举了要关注的指标,并有丰富的案例。
整个书的内容比较散,但依旧是讲互联网产品数据分析方面非常好的书了,对于想就职互联网数据分析的人来说非常实用。
《网站数据挖掘与分析》
本书从认知、技术、应用、管理和工具5个维度对网站数据分析进行了全面的讲解。具体内容包括: 科学地认识网站的数据分析 ; 从零开始建立企业数据体系 ; 网站数据采集和配置等。
《数据分析:企业的贤内助》
以企业经营中的案例为依托,将复杂的数据分析知识巧妙地融入其中,完整呈现数据分析项目的流程,系统阐述数据分析的专业思路、方法和技能!
但更重要的是,不要只看书,要尽快让自己步入实践阶段。数据分析作为一门技术,只有在不断地操作当中才能掌握真正的技巧和方法,将知识学以致用。
(附:详细推荐书单目录)
《与数据同行》为您提供最好的文章!
长按二维码关注“与数据同行”
猜你想看更多的文章👇
大数据也是个江湖:关于腾讯大数据“购买iPhone人群普遍无房无车学历低”的一地鸡毛
要看更多,请点击左下角阅读原文即可阅读整理好的所有文章!