进入一个全新的领域之前,最好能够对这个领域的知识体系、技能模型有全面的了解,这样你能知道哪些是应该学习,哪些是暂时不用学的,知道什么样的路径适合自己的状况。
基于数据分析这个技能,我们准备了一份“超级技能地图”,帮你快速认识数据分析的技能模块,以及不同的分支下,有哪些必备的技能,以及有哪些好用的资源。这一张图,可以帮助你快速认识数据分析这个领域,即便你从未接触过相关的内容,也可以很清晰地建立数据分析知识框架。这是数据分析小白必备的数据分析技能图,因为包含了Python数据分析全方位的技能体系,比如数据获取、SQL数据库、Python、统计学、数据分析核心模块、可视化、报告撰写等等都有详细拆解。
高效的学习路径是什么?就是按这样的顺序循序渐进,你会知道每个部分需要完成的目标是什么,需要学习哪些知识点,哪些知识是暂时不必要的。
一般数据获取有内部和外部两种渠道,内部数据可以通过企业数据库提取,需要掌握SQL相关的技能。
外部数据则可以通过公开数据集和爬取网络数据实现,需要了解相关的数据开放站点,以及掌握必要的Python爬虫技能。
SQL技能是数据分析师职位必备的技能之一,需要你对企业的数据库进行管理,能够正常地存储和提取数据。
当然SQL需要掌握的技能并不难,了解基本的语法,掌握基本的增删改查就可以满足常规的需求了。如果说数据分析需要什么数学基础,那统计学应该是设计最多的了,但不需要非常深入,因为大多数数据分析用到的无非是统计量、数据分布等基础知识。
利用Python进行数据分析,那Python的基础就非常重要了,这意味着你后续是否能够正常地用Python代码来实现你的分析想法。基本的编程规范、数据结构、自定义函数 、控制语句(条件语句、循环语句)、文件读写和模块使用都是需要重点掌握的点。在Python数据分析的体系内,Numpy / Pandas / Matplotlib三个核心库是绕不过去的。也是这三个工具,能够让你实现数据清洗、科学计算、数据分析、数据可视化等核心的工作。掌握这些,你就完全可以去实现描述型数据分析、探索型数据分析,再加上Sklearn,你可以去实现预测型数据分析,一个完整的数据分析项目,也不过云云。
数据报告撰写虽然看起来像是文档整理类的工作,但也是非常重要的,因为直接决定了你最终的输出成果。
对于如何撰写一份优秀的数据报告,问题拆解的逻辑、数据指标的选取、用户受众需求的分析、图形化的呈现形式都是非常重要的点。07 高清原图下载
由于微信上传图片的大小限制,上述高清原图已经打包完毕,需要的可以按照以下方式获取:
👆扫描上面公众号,后台回复:高清
获取高清图片
3、资源 | 宾夕法尼亚大学计算机系教授1900页机器学习数学全书,附下载链接
4、北大开源了中文分词工具包,准确度远超Jieba,提供三个预训练模型
5、Python 官网宣布,正式发布 Python 3.8.0!