查看原文
其他

为什么有些人用3年的时间获得了你12年的数据分析经验

2016-09-27 傅一平 大数据


本文作者 傅一平,首发于公众号 与数据同行(ID:ysjtx_fyp),由作者授权 大数据 转载。如需转载请与作者联系,谢绝二次转载。


最近科室进了不少新人,人多力量大是好事,但另一方面,对于人员的培养也让我很担心,原因是搞大数据形势不等人,数据团队的人要尽快成长,我们没有多少时间窗口,要尽量缩短人才的培养周期。


曾经写过数据分析师的自我修养等文章,这些套路很多人都懂,但有些人就是几年就起来了,有些人就是10年了也老样子,为什么?


成长的天空


写这篇文章,就是献给科室的新人,也献给有志于成为数据分析专家的人,希望大家能用三年时间完成普通人12年的历程,所以是这个时间,是因为笔者现在工作正好12年,但回过头来想,如果得法,新人通过3年就可以赶超,并且在以后的几年将我等老古董越甩越远。


很多人质疑,既然都提了3年,干脆能否1年呢,反正吹牛不打草稿嘛?但我觉得数据分析人员的培养还是有一些客观条件的限制,导致了再天赋异禀,也需要相对更多的时间。


我所谈的,不一定代表我自己就能做到,但是我见识了不少能人,通过观察和分析,还是能得到牛人所以为牛人的一些规律。



1、需要持续学习能力 


这个时代,人与人的差距,会因为学习能力的不同而越拉越大,为什么?


因为以前,信息不透明、信息不对称特别严重,因此,想学的人也没地方好学,差距不会拉得特别大,但现在移动互联网时代,没有获得不了的信息,只要你肯学,什么不能学?我们所谓的输,绝对不是输在起跑线,而是输在持续的学习能力上。


以前我们单位买过一个BRIO的报表展现工具,当时报表数据需要定时刷新,无法事件触发刷新,导致报表数据的刷新要么早了没有数据,要么晚了及时率达不到要求,对于这个事情,大家一筹莫展。


后来有个合作伙伴的一名员工,他自己从网上找到了这个工具的开发手册,自学了一个礼拜,开发出了一个事件自动刷新的接口,马上解决了这个问题,现在,已经是BAT里面某大数据事业部的总经理了,这就是学习的力量。


以前我有位同事,我每次很晚下班时候,都会撞见他没有走,桌子上总是放着书,并且每天晚上都在学习(比如R,白天工作太忙他说没时间),我问他为什么,他说:“不要扔掉未来吃饭的家伙”。


几年后,他离职了,去了BAT,现在混得很好。有时我们会自嘲:“公司成了BAT的培训基地了,三年是一个坎啊,走得,都是爱学习的人,但肯定没有一个是不爱学习的人。”


大家都说大数据很玄乎,不知道咋回事,可能你是个小白,对于什么马云等人的高谈阔论还处于高山仰止阶段,对于4V定义还挺觉得那么回事,对于XX大数据专家也是佩服的紧。


但半年后,当市面上所有关于大数据思想的书都被你轮了一遍后,你可能对于大数据的认识就超过了世界上99.99%的人,甚至可以挑战权威,这就是互联网和学习的力量。


为什么?


因为除了书本,充斥互联网世界的大多数信息仅仅是信息,它很难提升你的进一步认识,因为信息是碎片化的,你的时间是碎片化的,你的大脑刚刚进入一个学习的状态,你就把它换掉了。


大脑就好比一个数据模型,如果没有持续的刺激,是形成不了稳定的响应,更提不上更高层的抽象,这个信息转化不成什么价值,你看过就看过了,没有留下一丝云彩。


因此,刷爆微信朋友圈的信息、充满想象的网络小说,紧张刺激的游戏,99%对于人的成长没有价值,当然如果仅仅是娱乐,没有问题,但不要奢望从娱乐和消遣中获得知识。


大多数工作后没有看书的习惯,你看书,就是稀缺资源,观点就会比人多一点,只要你愿意持续的学习,你可以秒杀任何一个领域的同僚,终身学习者没有极限。


我们听不懂某样事情还可以去追根溯源,但如果不知道有这样一件事情存在就是非常可悲的事情了,只能在那边傻听或者大言不惭。


数据分析师在学习的同时,还需要一步一个脚印,不能急。


曾经有段时间读一本统计学的书,读了一天,没读懂几页,几乎要放弃,最后,换个时间换个心态,功利心小一点,还是读过去了,一段文字,你去死磕,时间砸下去,还是可以的,罗辑思维的罗胖是个文科生,很多科学的东西他也能掰一掰,就是这个理,他最具价值的一点就是能与书本死磕。


就像练跑步,开始慢一点不要紧,不要急,每天进步一点点,急了把腿搞坏了就得不偿失了,1-2年后,跑个半马也是可以的,因为到后面总是会越来越快。这个也很好理解,开始的时候,你的学习是割裂的,因此你很慢,慢慢的,你的知识越来越多,你逐渐可以触类旁通,举一反三,量变开始产生质变。


我练了半年跑步,有次送儿子去某个学校考试,闲着无聊就在400米操场跑了10圈,还感觉蛮轻松的,说实话,我从来没有在操场跑步超过5圈,因为有恐惧症,以前中学大学1000米考试已经要了我的老命。


前段时间王石与宝能万科之争的事情闹得纷纷扬扬,但锵锵三人行却在八卦他,说王石的脸有60多岁,但身板就如同20岁的年轻人,我们总是对于其登喜马拉雅山不务正业的事津津乐道,但对于其一点一滴的艰辛的跑步积累又有几个人关心,但他的收获是实实在在的,获得了年轻人的体魄和健康啊。


当然学习和钱没有直接关系,学习是一种价值观和生活态度,总希望对于这个世界的认识能深一点。



2、啃硬骨头才能野蛮生长


数据分析师总是痛并快乐的,甚至可以这么认为,如果你每天不经历一些痛苦,每天都是安安稳稳的,那就基本没有收获和成长,数据分析师总要面对太多的不确定。


数据分析师,天下唯一一个每天需要面对10维甚至100维世界的职业,你不入地狱,谁入地狱呢?


面对浩瀚的数据,你得去伪存真吧,清洗数据是脏活累活吧,分析建模让你生不如死吧,你会发现模型的原理不懂啊,参数不懂啊,然后你要回去找大学的老师,把原来的数学捞一点回来,然后你又发现挖不出来什么东西,花了老半天时间,一事无成啊,老板要你出分析给结论,你这个急啊。


数据分析师讲究创新,讲究总是面对新事物新情况,你要善于面对不确定,你总是面对硬骨头,你不能有完美主义,但你需要能趟过去,你会有很多的不爽。


比如看了卷积神经网络,不知道如何解释这个东西,因为没法解释,这个跟我们以前思考的方式不一样。


比如看了贝叶斯,看了逻辑回归,看了支持向量机,你这个数学白痴完全茫然了,很难区分哪个好,哪个坏,你希望用以前的方式追根溯源,把这个问题彻底搞清楚,但没人能告诉你啊,你只得自己找资料,自己啃,痛苦中的痛苦,但只要是你自己啃的,你懂了,就超过了大多数人的认知。


在传统企业艰难的转型中,你会突然发现你原有的知识体系崩塌了,原来离你很远的互联网的东西,突然需要你去掌控了,从搜索引擎、深度学习、区块链、社交网络、自然语言学习等等,你得自己啃,在较短的时间内消化掉互联网企业在原始积累中创造的一些东西,否则,你就赶不上趟了。


但对于外来的新的东西,我们天生就是非常排斥的,因此需要你去死磕,为什么?


因为我们是进化而来的,人类文明短短几万年,在300万年的人类历史中,却是沧海一粟而已,而我们的基因特性是在原始人类衣不裹腹中形成的。


为了生存,我们大脑天生就胆小怕生,安全总是第一位,野外见到老虎你第一反应,肯定是跑啊,即使你有枪,减肥为什么大多不成功,不是你不行,而是基因习惯于储存脂肪,减肥这个逆人类进化的怪物当然本能要拒绝它,我以前提过大数定律和回归平均,终归要回归混沌,你要不同就得跳出五行外。


举个硬啃的例子,你单位里的数据库的表有多少张,10万张有吧,作为数据分析师,你有勇气去轮它一遍吗?


轮一遍就是像编撰字典一样把每张表的元数据写下来,这其中你会架构你的宏伟数据目录,翻阅无数的开发文档,向千奇百怪的开发人员咨询问题,后台访问每一张表,对于数据的关联性进行核实,尝尽数据的冷暖人生,但可以肯定,轮过一遍,你就像过了八十一难,取了真经。


你总是要习惯在很难受的状态下去野蛮生长,数据分析师没有压力,就如行尸走肉,你总是需要去接受项目和挑战,数据创新是一个数据分析师永恒的课题。



3、越主动开放成长越快 


主动开放不是国人习惯的性格,因为大家都觉得内敛谦虚更好,但我越来越觉得主动和开放对于数据分析师太重要了,内秀型当然可以有,但主动开放型显然更有优势,为什么?


碰到很多新人,资质都很不错,但大多有个毛病,就是怕犯错,怕上级指责,学历越高越明显,特别是博士。实际上,谁会介意一个新人犯错呢,对于上级来说,宁可一个新人三天两头屁颠屁颠出现在它面前说自己的想法和一个不成熟的结果,也好过一个月才出现一次,然后害羞的说一句:”领导,我做了一个,你要不看看?“


这个时候,我可以100%告诉你,做出来的东西绝对是不行的,因为数据分析迭代是王道,没有毕其功于一役的事情,你的水平如果第一次就能入领导法眼,那就很不正常,但如果你得花一个月的代价去迭代,那成长速度就太慢了。


某种程度讲,衡量谁学得快,看他跑上级办公司的次数基本就可以判定了。


主动实际上意味着你会思考的更多,否则你提不出问题,能够跟上级交流的,代表了你已经可以跟上级对话,这个就相当不易,跟越优秀的人对话,显然对于你的成长越有利。


有次有机会去参加一个市长主持的会议,的确提得问题是很有水平的,针对性相当强,非一般人所能达到。


对于数据分析人员来讲,主动性要求就更加高了,分析本质上是为了决策,而决策权力在上级手里,你不主动沟通,何来决策,何来执行,一切都是空而已。


10年前听过一句话,今天拿来分享,“要把领导当成你的资源”,你越主动,资源就越多,你的收获就越多。


数据分析师会抱怨我既要面对机器,又要面对上级,好难,对的,但总是要相信,领导比你总是懂多一点,总能从领导那里学到更多东西,从而开阔你的视野。


领导没时间是你的借口,不要相信它。



4、通过习惯螺旋上升 


当任何时候你觉得难受,你的大脑就在进化;当任何时候你觉得轻松,你都在使用你的习惯,一旦你经历了难受,你就需要把它培养成你的习惯,从而让这些工作变成条件反射,这个时候,你就提升了一个层次,难受-习惯-难受-习惯,如此周而复始,我们正是这么螺旋上升的。


比如你练习取数,你以前习惯于串行跑数据,因此习惯于等5个小时出结果,但某一天你通过学习发现,通过优化程序可以并行跑数据1个小时就能出结果后,如果你能坚持这么做一段时间(难受),并行跑数据就会成为你取数的习惯,你不再能忍受5个小时的等待,你将总是习惯于用并行化的思维来解决问题。


你坚持每天晚上7:00下班,22天后,你某天想早点下班,你都会难受,觉得对不住公司。


你坚持走路听罗辑思维,以后每次走路,没有罗辑思维,你就好像被掏空了很难受。


你坚持每周去查询书单购书,以后每周没有书看,你就觉得会很空。


你狠下心去定了VIPABC网上英语,每周六你固定去学2-3小时,以后每到周六早上9:00,你就条件反射一样老老实实呆在电脑前等上课。


我拿这个理论可以改造我的行为,效果很好,大家会佩服不少人,而问这些人他们也没觉得自己有多厉害,但正是习惯造就了那么多坚韧的不同凡响的人,在他们看很习惯平常的事情在别人眼里往往是那么不寻常,比如原来我有位领导每天6:30就在单位了,你说寻常不寻常?



结束语


数据分析师是搞建模的(搞机器的),但首先要理解自己的大脑其实也是个模型,一定要通过定期的刺激(学习),克服起初的不适应(死磕),让它形成稳定的参数(习惯),然后持续迭代(螺旋上升),这样,你的成长的速度就超过了大多数人。


这就是我的依据,也是这篇文章的文眼,希望对你有帮助。




作者简介

傅一平 博士 毕业于浙江大学  从事电信行业工作,专注于大数据采集、处理、建模、管理、变现及产业等研究。

 




近期精彩活动(直接点击查看):

福利 · 阅读 | 免费申请读大数据新书 第12期 



END



大数据

为大家提供与大数据相关的最新技术和资讯。


长按指纹 > 识别图中二维码 > 添加关注


近期精彩文章(直接点击查看):

160904 2016年创业公司死亡名单:融资10亿、用户千万也救不活了!

160830 被失业!未来六大传统产业将这样被颠覆(超现实)

160829 为何你只能做出渣图表?数据可视化的十大误区

160828 2分钟读懂大数据框架Hadoop和Spark的异同

160827 说说什么是数据挖掘

160823 裁员浪潮+寒冬大逃杀,互联网人该何去何从? 

160820 39个大数据可视化工具,哪个才是你的菜? 

160816 上班族每次在地铁上花费37分钟,经过9.78站|2号线是上海经济命脉|上海地铁数据趣味研究

160812 五亿姓名数据分析|TF-IDF算法揭秘中国人名密码

160803 傅盛:深度学习是什么?

160731 力荐!大数据等各种IT技能图谱(全套13张)

160716 2016年上半年大数据方向就业形势重磅出炉

160714 关于反爬虫,看这一篇就够了

160710 他是比尔盖茨的偶像,用50年写出编程圣经,被奉为程序员鼻祖

160627 Hadoop创始人Doug Cutting谈未来大数据的技术

160614 世界顶尖数据科学家看未来十年大数据发展

160606 为不擅长编程的人准备的19个数据科学工具 

160522 长文 | 大数据思维的十大原理

160520 不让谷歌进来是对的。。。

160519 史上最全的大数据分析和制作工具

更多精彩文章,请在公众号后台回复000查看,谢谢。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存