正文开始
种一棵树最好的时间是十年前,其次是现在。十年了,本次分享大多来自工作中的日常所思所想,欢迎自取。
在招聘网站上输入「数据分析」,头部一些薪资较高的大公司岗位的任职要求里,会出现 Python、R、SQL、SAS、SPSS等的关键词,但是在一些小公司的JD中就会显得含糊不清。
「数据」可以说是二十一世纪非常值钱的一种资源,无论是现在热门的「人工智能」还是根据用户数据形成的「精准营销」,其最基本的基石都是数据。可以说现在这个时代谁掌握了用户的数据,谁就能在商业形成优势。然而这些优势不光能体现在公司层面,其实对于个人层面来说也是极其有价值的。那为什么选择做数据分析,为什么要转行去做数据分析,并且为什么要选择这个行业。是因为高薪?还是因为这个行业未来有发展前途?亦或是自己比较感兴趣?不少准备转行做数据分析的人都是冲着 Python 来的,毕竟 Python 是现在最热门的语言,近两年保持这语言类第一的宝座,而各大互联网公司的数据分析岗也会提出硬性要求:熟悉Python者优先录取,所以在很多人看来数据分析是一个写代码去分析数据的岗位。
早在11~13年的时候,很多公司根本就没有数据分析师这个岗位,几乎都是看到BAT类公司在鼓吹数据赋能,所以觉得自己公司也很有必要招一些数据分析人员,一个词:跟风。但对于如何用数据来驱动业务,完全不清楚,也不了解。现代企业中数据支点上主流的几个方向:业务数据分析、商业数据分析、数据算法挖掘、数据运营、数据产品、数据科学,这里面有些偏向业务赋能,有些则更加偏向算法开发。就某种程度上来说,分析既可以作为一个职业进行发展,与此同时,也可以只是一部分岗位的基础技能要求,所以才有了人人都是数据分析的概念。在现在这样一个互联网时代,网络缩小了大家的信息差,很多人在网上看完很多文章,对数据分析师的岗位职责和工作内容都了然于心,到真正面试的时候,往往会产生落差。业务数据分析师,肯定是和业务具有一定的相关性,需要配合业务部门去做一些分析方面的事情,而且一定是通过数据。实际上到了不同的组织、企业、公司,会发现大家好像都在做报表,通过数据去发现业务、产品上的问题,但是在不同的公司,处理数据时所需使用的工具、作业流程都有相当大的出入。一、现阶段市面上80%以上的公司并不知道怎么用数据来驱动业务增长,甚至不了解数据是什么; 二、数据分析师作为近十年才发展起来的一个职业,每个公司的岗位定位都不一样,必然造成一个结果,虽然大家都叫数据分析,但是职责却不一样。挂羊头卖狗肉的现象也比比皆是; 三、行业不同、业务不同,乃至挂靠的组织架构所在部门不同,作为分析师的工作内容可能也有很大出入;大公司和小公司首先在数据量上就不一样,另外像金融行业和快消品行业的商业模式也有很大出入,组织对于一个数据分析师的要求就会产生相当大的差异,说到底就是因地制宜,老板有多重视数据,就有多大的作为。稍微了解些数据行业的人都知道,在一个分析项目里面,几乎80% 的时间都花在了数据处理上,撰写报告、业务汇报是整个项目中的极其小的一个环节。(但是不得不说的一句是,写代码的比不过做PPT的),如果抛开这些,去聊数据分析师需要掌握哪些技能,根本就没有意义。譬如一家公司营销部门的数据分析岗,主要工作做一些统计报表,根据市场部业务的一些筛选规则来提取客户名单,听起来是不是好像并不难。如果数据只有1000多条,打开excel,对列进行筛选,或者写个公式,很快就能得到结果; 如果数据有几十万条,用excel可能会有点卡顿,但是还是能勉强筛选出来;如果数据增长到几百万条,excel就力不从心了,mac环境下打开可能就崩溃掉了,这时候就得用到sql或者python,用起来及其舒畅;如果数据一下子到几千万,excel2007版本以上单个sheet表的最大行数是1048576,可能需要10几张满负荷的表,如果电脑配置不怎么好,sql查询也极其慢,能查的出来但是可能查询一次10几分钟就过去了,效率极低;用python的话,载入到内存,运行的时候,不懂电脑的人可能会认为电脑的风扇是不是坏了。所以这时候需要用到hive,或者其他BI软件;
如果数据量大到千万甚至上亿级别,表的数量达到几百张这种情况下,是不是很崩溃,要怎么才能取出来呢,常规查询根本解决不了这个问题。在这个过程里面,首先就要确保提取数据的准确性就不能光靠肉眼去看,然后了解各种表的字段含义,关联方法,就需要大量的时间,前提是有数据字典的情况下。所以,要想做好一个表哥、茶树菇也是不容易的,只要数据量足够大,就能把80%以上的人挡在外面,更谈不上从数据中挖掘出有效的信息,做业务驱动、数据赋能了。如果用上面的的工作内容去匹配网上介绍的商业数据分析师的工作内容,估计一个都匹配不上。我们会发现现在市面上的书籍、培训班课程,往往都是偏技巧、架构和产品,再就是一些工具、方法(python 、算法、机器学习类),讲课或者分享的内容大多数都是讲基础层面的东西,类似于统计学的基本概念、工具的使用入门等等。主要因为这些知识是可以被抽象化、结构化的,只要把实践过程中的精髓讲出来,通过工具进行视频进行录制,再之后做运营传播,就能给培训者带来诸多的收益。也能很快帮助初学者快速入门,掌握一定的技能,但是解决不了太多的实际复杂的问题。而对于业务分析,不管是在培训课程还是在书籍上案例都特别少, 大多数还是偏概念 、理论方面的知识,没在其中很难领会;深入业务后,发现每条业务线分类繁杂,都需要耗费特别多的精力去梳理产品流程,数据和业务之间的关系、切入点,还需要对接各个部门不同人的需求,极其琐碎零散。最最最关键的还是做完一轮分析,老板还不关注,觉得一点都不重视,然后就迷茫了,我到底该怎么做。业务分析,个人感觉挺复杂的,不同的企业不同的业务情况都不同,场景模拟也就难一些,没人愿意把真实有效的东西讲出来。并不是不愿意出来讲课,因为这都是秘诀,个人赖以生存的秘诀,真正打造区别于他人之间的核心竞争力的部分。一般来说,核心的东西都是一对一的影响出来的,放在一个群体里面,不合适。因为你不知道谁学会了,然后就把自己饿死了。就譬如我现在在做的,如何从数据中挖掘商机做数据变现、如何利用数据链路去做产品设计、企业中如何做好数据化落地、如何实现数据驱动业务、如何做企业级的数据治理、如何去整合资源做好行业白皮书等等,这些落地的经验都显得很宝贵,构成了个人的核心竞争力所在,也是未来往上走、求职路上必备的钥匙。跟对人+合适的工作场景,就像是坐上了火箭。跟对人还蛮重要的,做事的方式、管理的方法、业务处理技巧、理论的实践,真正落地的过程贼艰难,前面有人躺了,后面的人才能更快的轧过去;数据行业发展也是非常快,可能今年会 Python、SQL、Excel 还能找到工作,但到明年说不定最低要求就变成对业务要比较了解,或者是懂建模也说不准。要知道现在各大高校已经纷纷开设数据专业,等这些人毕业以后,你能和他们拼的只有经验了。一、数据行业未来发展前景很棒,这个毋庸置疑,中央一号文件、各省红头文件中,明确表示未来几年要加强企事业单位的数字化转型发展;二、要尽可能多的接触数据,用数据去阐述问题,数据量肯定是越大越好,这对培养自己的大数据思维有一定帮助(真实数据一般都很难能够拿到,打比赛是一种途径、找公开数据集的网站也是一种途径,尝试着做一些分析案例出来,讲清楚目的、问题、数据、结果);三、如果想进某个行业,多关注下社群、多关注一些公众号,看看这个行业内的分析师是什么样的?然后再有针对的进行学习;四、如果对行业认知很模糊,那就先去一家公司待着、感受,然后在一个业务过程中建立自己的认知,丰富知识结构、业务知识,然后抓紧时间去投递简历面试,做各种尝试,直到找到方向;五、如果还没有入行又想进入这个圈子,不妨把路子放宽一点。像数据运营、业务分析、产品运营之类的岗位也可以去尝试,只要能够接触到数据,其他的都可以根据目标去适当调整,曲线救国是大多数人的一种选择。到底,指标波动多大才算大?看过这些才明白......
为什么数据分析师需要懂点算法?
【7000字】从 0-1 构建指标体系
到底,指标波动多大才算大?看过这些才明白......
理解业务对数据分析重要性不言而喻
点击左下角“阅读原文”查看更多精彩文章,公众号推送规则变了,如果您想及时收到推送,麻烦右下角点个在看或者把本号置顶!