书豪采访记(二):机器学习牛人鲁伟
书豪,数据分析工程师 ,“人工智能爱好者社区”公众号负责人。
微信ID:wshinvest1
非常感谢鲁伟,能够抽空接受我的采访。我第一次见到鲁伟是在2017年12月3号,上海第十届中国R语言大会举办会场的会场外,中午我们数据群里的10来个网友,当时鲁伟还处于毕业答辩期找工作的阶段。鲁伟毕业的这两年成长非常快,一直到现在,他仍然在他的公众号机器学习实验室孜孜不倦的写文章分享他的学习笔记,他成功的在数据行业扎根成为一名深度学习工程师。
鲁伟是一名统计硕士,他与数据结缘初始于R语言,后衷情于Python,从数据分析到深度学习一路走来,他坚信数据技术和代码改变世界。目前在机器学习和深度学习修炼进击中。他的人生定位是为成为一名未来的数据科学家而奋斗终生。
鲁伟是非常非常拼搏坚毅的一位朋友,他的努力拼搏,也让他能够在毕业两年时就在杭州买房,优秀的人必然有许许多多的特质。我们采访了他一些问题,给各位读者朋友学习观察。读采访文之前,各位读者朋友,我们一起大声的朗诵一句鲁伟的人生座右铭会当击水三千里 自信人生二百年!
说不可替代性有点言重了,我觉得很少有人能做到不可替代,当然我相信每个人都在努力提升自己在公司的不可替代性,具体而言我认为可能有三个方面,技术能力、业务经验以及个人心性。就我个人而言,可能最有优势的劳动价值在于自己是一个努力践行数据价值落地的人,总会希望能够将数据与业务充分结合。
觉得自己最牛逼的能力是什么?
持续不间断的学习能力。
工作的这一两年来,最艰难的时候是哪段经历,当时经历的困难是什么?如何面对的,是如何爬出这段艰难的处境的?
最困难的就是现在,感觉遇到了瓶颈期。自己的个人发展和公司安排的项目任务方向有不小的冲突。目前还在努力寻找解决办法。
你经历过的至暗时刻大致是什么样的,为什么说它是你的至暗时刻,主观能力和客观环境当时是什么样的?
大概是考研失败吧。当初对自己期望过高,我报考了厦门大学金融工程专业的研究生,基本上就是身边认识我的人都觉得我能考上,最后非常可惜的是总分过线,专业课被卡了,当时我从来就没想过我没考上该怎么办的情况。这种你本能够的事情却没做好是最让人痛心疾首的。后来自我做了反思,一直觉得当时的主观能力是足够的,客观环境差了点,可能就是时运不济吧。
应该有很多,说一个最近认识的吧。中科院自动化所的,目前在做深度学习与机器视觉,每天500行代码,每天读paper跟喝水一样,C++写的贼6,而且不光懂技术,什么政文史哲都会。从他身上得到的启发就是有时候人与人的天赋差距真的很大,但持之以恒的专注度和意志力是我一直需要学习的。
技术成长最快的一段时间当时面对的是什么样的环境下,为什么说这段时间成长环境最快。
刚毕业工作的一年内,可能也包括现在,但我不确定。刚参加工作,不会和不熟的东西比较多,又有人带,加上工作环境驱动,进步空间大,所以一般而言这时候成长是相当快的。
未来3~5年的打算是什么?打算如何突破这个打算,量化来说,困难程度有多大?需要的运气成分有多大?
想专注于深度学习,无论是CV还是NLP,也想回去读个博士,但目前背了房贷,经济条件不允许。所以打算给自己定个三年目标实现财务上还房贷的自由,到时若有老师愿意接受我,再回去读书。努力争取的同时也看缘分吧。
如果有天你失业了,会如何面对这个处境。当前的危机在哪里?
虽然我工作还没满两年,但去年年底和今年上半年的这个互联网寒冬让我切实考虑过这个问题。所以一直在想怎样才能把副业完全做起来,以至于哪天失业了也可以有饭吃。至于当前的危机主要就是现在这个AI泡沫还是很大,今年的互联网寒冬已经体现出来了,什么时候你所在的部门没有实际产出了,不能挣钱了,估计就离失业不远了。
我觉得只要是数据分析、数据挖掘或者机器学习方面的,SQL和Python现在都是必备,使用比例大概3:7吧,对于数据分析人员而言SQL最基础的基本功了。Python的话,常用库就是numpy、pandas、matplotlib、sklearn、tensorflow、keras和pytroch这些了,自己写类是一定要写的,代码规范的需要。Python能做的比较多,我目前主要就是机器学习和深度学习这块。
缺点可能就是coding能力不是很强,非计算机科班出身可能本身这块就会弱一些,但也一直在补。未来可能不大会继续从事医疗场景的数据分析,更希望从事互金或者智能安防这块。
说实话,从小在父母的庇护下长大,真没觉得吃过什么苦。都说现在孩子读书辛苦,我觉得也并没有那么夸张,很多时候就是一个自律和效率的问题。要说稍微苦一点就是考研期间或者是现在,每天都学习到很晚,但自我并不觉得有多苦。
对于生存来说,你觉得自己最大的弱点是什么, 策略上,你是如何规避这个弱点
或者是不善交际?明明手里有些资源和人脉触手可及,可就是懒得跟人打交道,就喜欢自己安静的学习和搞研究。今年打算对外开放一些,多与人沟通交流。
夫妻最重要的是两人同心,我觉得两个人一起谈恋爱是一回事,但结婚过日子又是另一回事,最重要的是两人步调一致共进退。当然还有其他很多需要考虑的,距离、双方家庭、经济实力、学历阅历、颜值等等,最重要的还是人要好。
应该是读研时候在人大经济论坛上帮人写了个R语言程序吧,钱不多,但很有成就感。有时候就想特么本科时候天天都在干什么,早干嘛去了。本身是学统计的,当时写个R程序没啥难度,更重要的是兴趣。
当下,你最担心什么,最害怕什么,为何会有这个恐惧,你会如何破局!???
最担心父母的身体健康。今年刚结婚买房,现阶段承受风险能力极弱,所以我一直在思考如何把风险规避到最小,往后会更加重视双方父母的身体健康,当然也包括夫妻双方个人的。
你人生中对你最有帮助的贵人是谁,对你有什么样的影响,为什么?
要说贵人,那真是太多了。就拿狗熊会来说吧,我觉得我能走到今天很大程度上与狗熊会的各位老师有关,包括北京大学的王汉生老师,央财的潘蕊老师以及人大的黄丹阳老师,我从各位老师那里学到了朴素的数据分析理念,这种理念一直受用到现在。
1. 相当于做了技术笔记
2. 对技术原理和认识更加深刻
3. 对构建个人知识体系帮助重大
4. 养成坚持、自律的习惯
5. 快速查找到目标资料的能力
6. 提升了写作能力
7. 提升了代码能力
8. 认识了更多的志同道合的朋友
9. 能带来额外收入
10.通过公众号逐渐打造个人IP
平时工作中会用到哪些算法,在算法方面的能力你是如何突破的?
机器学习这块传统的单模型都不大会用了,主要就是集成学习的GBDT系列。深度学习的话ResNet、DenseNet以及一些检测和分割的算法。算法提升的话:数学推导+从大头到尾手动实现一遍。基础算法刷leetcode,机器学习算法多啃个几遍统计学习方法,深度学习的话多读paper
在github上,你经常看哪三位大佬的github更新,从这三位github大佬账号上学了什么内容,对你工作上的应用点在哪里?
我个人用github不大会时常关注某个人的更新,更主要的是读一些经典package的源码之类的。
你平时用stackoverflow解决问题的内容方向一般是什么,与国内的技术社区相比,使用stackoverflow帮助解决你工作中技术问题的比例是多少?
比例挺高的,主要是利用谷歌解决问题的能力。谷歌搜出来很多都是stackoverflow给出的解决方案,还有GitHub的。与国内技术社区相比的话7:3吧。
鲁伟个人公众号:机器学习实验室
推荐阅读: