【开工大吉】回顾与展望转行数据科学路上的点点滴滴(2016-2018)
作者:王大伟
Python爱好者社区唯一小编
博客:https://ask.hellobi.com/blog/wangdawei
大家好,我叫王大伟,热爱数据科学。
转行之前的迷茫
这个故事很长,请自备花生米和瓜子,故事要从2016年9月说起,那时候我大四,差一名保研成功,也就是说得考研才能读研究生。
当时也没想过转行,还在读我的过程装备与控制专业(在华理,大家都称这个专业为化机,也就是化工机械)。
当时据我所了解到的,华理的化机其实也是全国排名前几名的,这个专业比华理好的,一般比较认可的有天大,浙大,西交大,清华等。
一开始考虑考浙大,毕竟比较近,学校也很好,但当我看到之前几年的复试线在370-385的时候,一周后就放弃了,我害怕再一次的失败,我只想一战成功。
于是,我想了想考本校也不错,并联系了我现在的导师,当时还问过专硕是否能读博,现在想想当时真是太天真了,读博是不可能读的。
之后就投入了疯狂复习的节奏中,每天和几个小伙伴一起复习,也就不觉得多累,再说华理还是很好考的,毕竟我考的专硕。
当时大部分情况就是保研同学过着猪一样的生活,考研同学过着狗一样的生活。
初步接触Python
考研12月结束,通过了初试复试,来到了大四下学期,当时只有毕业设计和毕业论文要做。
闲来无事,除了打打游戏,本科时候比较喜欢数学建模,当时听得比较多的是大数据,机器学习,自己看了看,感觉和数学建模还是有相似的地方,就觉得学习一下。
当时朋友推荐学R语言,我就买了本薛毅老师的黄皮书《统计建模与R语言》,发现这个R语言比Matlab用起来舒服很多,但是刚看不久之后,朋友告诉我有个叫Python的编程语言,挺推荐的,我当时也不知道用什么学习资料比较好,就看网上的爆款入门基础书,Python基础教程(第2版·修订版)。
买来之后发现他是用Python2版本写的,看到第六章就出现魔法参数了,当时看的不是很明白,就没继续看下去,对于一个有c语言基础的我,并不觉得这本书适合新手入门,之后看了一写零碎的视频,如小甲鱼的(挺幽默,不过入门部分学完直接去写飞机大战了,醉了。。),听说廖雪峰老师博客的很不错,看了看,还是挺难的,说实话,觉得他写的比较正经(相比于诙谐幽默风格的小甲鱼),每当看到评论区的大牛蒂花之秀,我学了几章就放弃了,可能是我当时学习方法态度不太对吧。
之后买过一本国外的head
first in Python 和head first in
数据分析,国外的书就比较轻松幽默,写的不像国内很多书很理论,他们配上故事情景和大量插图,我学的津津有味。
有个好老师很重要
在偶然间,群里有人发了天善智能的信息,当时抱着看看的态度,点开看到天善智能是一家主打线上教育的网站,当时有一门Python数据分析与挖掘正在打折销售,我购买之后,跟着韦玮老师一起学,从入门基础,到网络爬虫,再到数据分析挖掘,韦玮老师讲课通俗易懂,我很是喜欢,对数据科学越发沉迷。
学完了这一系列课程,有种我已经很厉害的假象,并且当天善的2017SVIP推出时,我立刻就报名了。
已经2016的12月底了,由于研一下学期课不多,想去实习,朋友推荐了一家数据类公司(名字不方便透露),当时约了年后很早就来面试,于是,我寒假又补了很多课。
积累不够,处处受挫
过完年,兴冲冲去面试实习,实习面试前后面了两轮,面试的是数据分析岗位,当面试官拿着我的简历看的时候,问我学机械为何想做数据,问了很多计算机专业基础的问题,比如进程与线程的区别,红黑树,研究生数学建模比赛,前面一个面试官表面上还是对我挺满意的,之后的面试官问的最后一个问题是,给我一张纸,让我写一下堆排序,我当时比较崩溃,堆排序只是在算法导论上看过,建立堆什么的,让我现场写还是完成不了的,我当时询问能不能写个冒泡排序,他说ok,我慢慢写完,也不知道有多少语法错误。离开的时候就知道已经凉凉了。
之后又面试过两家,其中一家问了决策树应用,超长字符串合并,当问到我竟然连数据仓库都不了解时候,我就知道我又凉凉了,还有一家是做量化的,当了解到我技术没学多久,让我明年再来试试。那天面试完就去了天善智能梁哥这里,聊了一会,梁哥问我是否要来实习,我说好啊,他说之后需要的话会联系我,并送了我一本数据实践之美,把我送到了浦电路地铁站。
2017,神经兮兮(双押*2)
当时可能也是比较"倔强",疯狂投了十几份简历,有3~4家让我去面试,其中有一家是做股票的,让我先完成一个任务,去雪球网抓一些股票数据,当时我用fiddler抓包完成了,他邀请我之后去面试。
当天晚上,梁哥打电话给我,问我是否能来实习,我说好啊,然后婉拒了所有面试邀约。
3月初在天善开始实习,做的主要是运营的工作,闲时学学Python和数据科学,从零开始做Python爱好者社区公众号,现在已经有接近7w粉丝了。
之前在天善实习的黄成兄弟在工作上给了我很多帮助,在天善收获了很多,做过活动策划,写过软文,给课程学员答疑,在社区答疑,每次都会有不同的收获。
从梁哥鼓励我写文章,到现在已经自发在博客上写了89篇文章,每次写文章既是对学习的总结记录也是对后来者的分享。
在2017,认识了祥哥,加入了数据取经团(公众号:数据取经团),认识了一群小伙伴,我们一起写文章分享,平时开开远程会议,为了提前融入工作的环境,在你们2017找工作的过程中,更加感受到技术和项目的重要性,数据分析数据挖掘岗位对数据挖掘算法,数理统计,SQL,数据结构算法都有很多考察。
在学习方面:
在SQL方面,SQL是数据分析者必须会的技能,当时学的是慕课网上的SQL入门,然后学习了《SQL必知必会》(封面是旅行青蛙变种模样),最后在牛客网刷了60+题(现在已经忘得差不多了),明年校招前还要复习一遍。
在网络爬虫方面,学习了一些天善的课程,看过几本书,比较熟练之后,在西安给学员内训了两天,之后在上海天善给学员(20+人)也内训了两天。当然爬虫只是获取数据的一种方法。
在数据分析挖掘方面,系统学习了天善丘老师的数据科学课程,说实话,这在数据科学课程中见过的讲课最好的老师,全程没有多余的话,思路条理非常清楚,从数据获取,数据清洗,数据集成到数据建模一整套下来,对数据科学有了更深入理解,在学完课程之后,我写了一篇Python对上海二手房的数据分析,当时数据可视化学的并不太好,直到之后学习了pandas的绘图和顺祥哥的文章之后,稍微好一些了(和R的绘图还是不能比的),一时兴起从kaggle上找到数据写了葡萄酒数据分析和纽约皇后区的数据分析。
在机器学习方面,视频看的不多,看了数据挖掘导论(很多机器学习算法和数据挖掘算法相似)+西瓜书+统计学习方法,这三本吃透的话理论上比较完善了,之后上手代码,有自己造轮子的机器学习实战也有sklearn官方文档,现阶段还在学习中,提高编程能力。
在coding方面:报名了PAT,改用c和c++刷题,最近也在写Python数据结构算法连载,将c和c++的解题转为Python解题,这对我也是一大挑战(不考虑Python的运行内存和时间,重点是算法和实现),之后准备刷leetcode,校招很多笔试题都有编程大题。
之后会写一篇看过的书的感悟与评价。
比较开心的事
在2017,为了分享学习Python的历程,为了让后人少走弯路,写了Python从零开始连载,入门部分已经写完,也有视频微课,已经4000+人学习啦,因为连载文风清奇,获得不少好评(我脸皮厚),之后给Python进阶连载开了个头,Python数据分析(kaggle)开了个头、Python数据结构算法刷题开了个头、什么都想写。。
为了弥补转行的知识缺失,在2017年参加了国家软考,拿下了初级程序员和中级软件设计,证书本身对我用处不大,但这个过程让我对计算机基础知识有了更深入了解。
压力很大,动力很足
之前还有玩游戏,最近全卸载了,要做着机械导师的任务,一边实习,一边学习,时间很紧迫,基本没有娱乐(除了躺床玩一会手机,在群里聊聊天放松一下),每天基本都在学习新知识,压力很大,动力很足,毕竟距离校招只有半年了。
2018学习计划
1.年后去找一份实习,最好能接触到一些项目,这也是目前我比较缺失的,有内推请大佬们联系我啊~
2. 把数据库工程师考下来,因为涉及到SQL,边考边学。
3. 文章继续保持更新输出。
4. 在天善开新的微课和系统学习课程,每一次的分享都是对自己的锻炼。
5. 保持不断学习的热情。
对转行者的建议
1. 了解清楚你即将去的行业,是否真的感兴趣,毕竟可能要做一辈子相关工作。
2. 数据科学没有想象的简单,需要在理论和coding上花大力气,你是否想清楚了。
3. IT从业人员普遍薪资较高,但背后是不断学习和可能长时间的加班,发际线虽然后移,但你的技术在进步。
3. 数据科学会逐渐渗入各行各业。
看到这里,你的瓜子花生米吃完了么?
小编的免费Python入门课程已经登场,等你来撩~
已经5000+小伙伴加入学习啦~
点击阅读原文,立即学习
Python爱好者社区历史文章大合集:
Python爱好者社区历史文章列表(每周append更新一次)
关注后在公众号内回复“课程”即可获取:
小编的Python入门视频课程!!!
崔老师爬虫实战案例免费学习视频。
丘老师数据科学入门指导免费学习视频。
陈老师数据分析报告制作免费学习视频。
玩转大数据分析!Spark2.X+Python 精华实战课程免费学习视频。
丘老师Python网络爬虫实战免费学习视频。