查看原文
其他

如何在业余时间学习数据分析?

蜜柑 读芯术 2019-12-26


全文共3646字,预计阅读时长8分钟



最近小芯发现,越来越多的互联网公司,在招聘要求里都加了这么一条:掌握数据分析技能。

 

比如腾讯某产品经理岗位的招聘要求:


具备一定的数据分析能力,至少能熟练使用Excel 的透视表和 vlookup。


要是你连Excel的透视表和vlookup函数都不清楚,那必然是会被拒之门外。


再比如去哪儿的运营实习岗位要求:


会使用 SQL(SQL is a must),精通 Excel 公式函数;


对数据敏感,能够发现关键数据、抓住核心问题;

你以为运营岗就是动动手指发条微博,没事和大家灌水聊天就好了?太天真了!你必须掌握SQL语句来操作数据库,此外,你还得精通excel的各类公式计算函数,对数据敏感,让数据来指导你下一阶段的运营工作。

不管是技术岗、产品岗还是运营岗,都或多或少地对求职者的数据分析能力提出了明确要求,拥有数据分析能力的同学,往往会在竞争中被HR优先录用。

 

所谓“技多不压身”,利用业余时间学好数据分析,不仅能为你的简历增添亮点,也能够帮助你解决生活和工作中的许多实际问题。



数据分析要学好哪些基本内容?

 

基础很重要,凡事先入门。对数据分析而言,统计知识、数据库语言、数据分析工具三大基本内容不可或缺。在这基础之上,你还可以继续选择数据可视化与数据挖掘的内容作为进阶学习哦。


1.理论基础


如果你是理工科学生,想必对概率论与数理统计、线性代数、离散数学三门课并不陌生,而它们也是和数据分析有着密切关系的数学基础。概率计算、回归分析、泊松分布、正态分布、置信区间、假设检验,这些知识点常常在数据分析中被运用,贝叶斯定理更是数据挖掘中分类器构建的基础。在入门数据分析以前,你可以重新巩固相关的数理知识点。


2.数据库语言


数据分析中的另一大基础是关系数据库标准语言SQL,这块内容也是计算机专业学生的必修知识。常用的SQL语句并不多,但都要求我们必须掌握!通过基础查询、聚合函数、嵌套查询、连接查询等知识的运用,我们可以有效过滤海量数据,同时对数据实现分组聚合。


3.  数据分析工具


Excel:也许你会对Excel嗤之以鼻,不就是个制作表格的吗?但其实Excel中许多隐藏技能是数据分析中的大杀器!你需要了解Excel的各类函数,如sum/count/if/rand/find/replace等;在Excel的诸多功能中,vlookup函数和数据透视表是极具性价比的学习重点,vlookup能够纵向查找,帮助你核对数据,数据透视表则可以让你轻松完成复杂数据的分类汇总。此外,应用于office中的编程语言VBA也可以让你实现许多意想不到的功能。


Python:作为一门简单高效的编程语言,Python在数据分析工作中备受欢迎,它拥有许多优秀的库,可以协助你的数据分析工作,譬如pandas能帮助你进行数据清洗与可视化,numpy可以简便数组计算,scipy能够实现不同的假设检验,scikit-learn则可以对完整的数据分析建模……如果你已经熟悉了Python的基本语法,不妨了解相关的库来简便数据分析问题。


4.数据可视化工具


觉得用表格展现数据结果太low?数据可视化工具分分钟让你的结果变得高大上!Tableau支持对数据进行不同维度的分析,而且提供了近百种不同的数据呈现方式,让你的数据结果更美观也更直观,发挥出其最大价值。


5.进阶之数据挖掘


如果你想在数据分析上有更深的造诣,那么不妨尝试一下数据挖掘的工作。这需要你熟练linux环境下的编程,学习更高级的机器学习算法,比如决策树、SVM、聚类、线性回归、随机森林、贝叶斯等内容,并了解Hadoop和Spark等大数据开源工具。


数据分析的流程是什么?


1.提出问题


数据分析不能为了分析而分析,而是要落到实处,去解决现实生活中某个问题。因此,提出问题是数据分析的第一步。比方说,你会想知道,知乎上热门答案的答主都来自哪些领域?学校图书馆里哪几类书籍被借阅的次数最多?为什么这个微信公众号能火?最近《复联3》上映了,观众的普遍评价是什么?明确了你想要解决的问题,也能够驱动你的研究兴趣。


2.数据获取


在明确了问题后,接下来则要收集解决问题所需的数据。你可以选用Python的爬虫框架Scrapy,采用编程的方式自定义数据来源与格式,抓取web站点中的结构化数据,通过爬取、解析、存储等过程,获得自己想要的数据,比如豆瓣9分以上的电影,知乎的高赞排行,某个行业的人群信息等等。


此外,一些数据平台也能够提供优质的开源数据,让你可以尽快启程数据分析之旅。比如数据分析与建模的竞赛平台Kaggle上就专门设有dataset板块,为你提供众多关于政府、医疗、科技、流行趋势的开源数据,类似的优质免费数据还可以从World Bank Open Data上获得。


3.数据处理


我们采用的数据可能存在重复、不一致、缺失、异常等情况,因此需要用Python Pandas来完成数据清洗。比如判断并清除数据中的异常值和重复值,针对数据缺失的情况进行数据补全,利用各种逻辑关系整合有关联的数据,由此得到完整正常的数据。


4.数据分析与输出


通过数据可视化的方式,我们把一行行的数据输出为美观的图表,让数据的占比、趋势走向与对比关系更加直观。结合这些可视化图表,我们还需要采用一些数据分析方法来总结数据内容,进行数据决策,最后撰写出一份数据分析报告。


如何训练数据分析的思维?

 

小芯在上文中介绍了许多数据分析的工具和方法,或许能帮助你在短时间入门,但如果想走得更远,还是要依赖于数据分析中最关键的核心——数据分析的思维。以下是一些思维技巧,可以帮助我们不断优化数据分析思路。


1.5w2h分析法——确定问题含义



对于一个被提出的问题,我们可以通过4w来搞清楚发生了什么,再通过why和how的询问来设想问题的原因和处理方案,通过5w2h的分析方法,我们能够确定数据指标的含义、统计时间和计算公式,帮助我们打下后续数据分析的地基。


2.结构分析法——建立问题结构



通过建立问题的树状结构,我们可以看到问题的各个部分在整体中的位置及占比,从而理解问题的轻重,哪部分内容是解决问题的关键。


3.对比分析法(横向)——判断问题大小



在判断问题大小的时候,我们可以设定关键性指标,与同领域或者类似产品做对比分析。比如对比不同的渠道来源、不同的产品内容、不同的版本、不同的用户群体,从而了解数据的真实情况。


4.趋势分析法(纵向)——看清问题缓急



单看静止的数据,我们难以得出想要的结论,如果能够加入时间纬度,就能更好地发现数据整体变化趋势。如果我们要对公众号月度数据进行分析,不妨将日阅读数据做成一个折线图,从而判断各阅读数据在整体数据中的位置,以及阅读趋势走向如何。


5.矩阵分析法——分析问题原因



在分析问题原因时,可以利用矩阵分析法,将问题分为四个象限去研究讨论,我们所熟知的SWOT就是矩阵分析方法的一种。从结果反推原因,也是数据分析中很重要的一环哦。


如何利用好业余时间?

 

还是大学生的你,或许时间会被课内学习、项目实验和论文所塞满,有的时候还要兼顾实习和社团活动,往往是信誓旦旦地说要开始学习数据分析,到头来却一事无成。那么,有没有一些高效的学习方法,能够帮助我们只利用业余时间也能掌握好数据分析呢?


1.列好一份数据分析的学习提纲。


在开始学习数据分析以前,你必须要明确自己短期的学习目标是什么,并将这个大目标分解成小目标,把每周和每天的任务具体化。假设你是一个数据分析小白,你的目标是在两个月内入门数据分析,那你需要列一个八周的学习提纲,确定每一周要攻克的学习重点,比如第一周掌握Excel,第二周学习SQL……用目标来激励自己,推动学习进度。


2.将碎片化时间用来阅读数据分析的资讯。


数据分析需要你能够系统化地学习实践,因此宜利用好大块的时间。这需要有意识地记录自己一天中的时间分配,从而寻找到可以利用的整段时间。而碎片化的时间更适合我们用来捡芝麻,比如刷刷知乎和公众号,了解数据分析技巧和学习思路。


3.学习时设定闹钟,关闭手机。


利用业余时间高效学习的关键,就是在学习过程中高度集中注意力,不要让其他事情割裂自己的整块时间。如果开始了今天的学习任务,就设定闹钟,关闭手机,在响铃前全身心的投入到学习中吧。


4.务必复习前一天的学习内容。


根据艾宾浩斯遗忘曲线理论,如果学习的知识没有在第二天及时复习,就会迅速被遗忘,因此需要你在开始第二天的学习任务前回头巩固学过的知识。比如你可以在脑海里回想:昨天在实践数据分析过程中,用到了哪些工具和算法?具体的操作流程又是哪些?以此来不断加深自己的记忆。


5.使用时间管理应用来提高效率


你可以尝试一些工具来帮助你利用好有限的时间。比如Forest,这是一款能帮助你专注于学习任务的app,你需要设置种树时间(即学习时间),单击开始种树,如果在这段时间里偷玩了手机,种的树就会枯萎,通过获得激励的方式让你摆脱手机依赖症。或者你还可以尝试一下Wunderlist app来列todo目标清单,使用Blocky Time时间块app来追踪自己一天的时间分配,使用XMIND来绘制思维导图、构建知识树。类似能够帮助你进行时间管理的app还有很多,可以根据自己的实际需要去选择。


读芯君开扒


数据分析让你的工作如虎添翼


小芯在开头也说到,数据分析在日常工作中应用广泛,如果能结合你未来的就职意向对症下药,针对性地去深挖数据分析技能,就能起到事半功倍的效果。


比如,如果你想从事前端开发,不妨在数据可视化方面稍加用力,深入学习d3.js和echart的内容;如果你想从事财务分析,那么学习BI(business intelligence)进行商业决策必不可少;如果你想做大数据开发工作,Hadoop2也是你要攻克的重点。


在制定了适合自己的学习计划后,不妨充分利用好业余时间,就此踏上数据分析学习之旅。小芯也祝大家学有所成,让未来的你感谢如今拼搏的自己!


留言 点赞 发个朋友圈

我们一起探讨AI落地的最后一公里


作者:蜜柑

参考文献链接:

https://www.zhihu.com/question/22119753/answer/303533823


如需转载,请后台留言,遵守转载规范


推荐文章阅读


都在学AI,未来人才饱和了咋办?

小米8是黑科技?No,五彩斑斓的黑在这些手机里

想成为顶会论文大佬?这些捷径需GET

回顾 | ACL2017 论文集:34篇解读干货全在这里

学AI,如何挑选学校和机构?

学这些,本科不用转专业也可以搞AI

AI时代,大学生如何选择实习机会?

搞科研OR创业?快看看你适合哪条路!

国外牛校的AI专业竟然是这样的!

图灵大会 | 青年说:青年学者都在纠结啥?

图灵大会 | 最前沿:独角兽公司的大佬们都在谈些什么?

图灵大会 | 新观点:AI盛世,其实我们离得还很远

图灵大会 | 大咖说:哪些技术即将改变世界?

图灵大会 | 黑科技:这几大亮点,我一次性给你说全了

图灵大会 | 百度高级副总裁王海峰:未来搜索将无处不在

想从事AI行业,读研还是工作?

不想被AI淘汰?毕业前你需要打造三种能力

从零开始,带你编写AI程序

不懂Python ,照样能入AI圈!

还好我长得安全,是这个世界最不该说的一句话

Siri 傻傻听不清?教你DIY提升TA的智商!

这份向母亲示爱(AI)的礼物清单,比康乃馨强一万倍!

机器学习第一步,从向量和矩阵开始!

你是否对区块链一无所知

这年头,你连吵架都吵不过AI了……

什么?这个大数据比赛既有奖金还能提供工作?!

学AI,连你的老师都那么拼,你还有什么理由不努力?!

[大咖专访]CCF IT女性精英大会(二):具备“爱”的能力,敢于向权威挑战

CCF IT女性精英大会(一):勇敢说“愿意”,为自己发声


长按识别二维码可添加关注

读芯君爱你

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存