查看原文
其他

一个研一统计学硕士过年期间的思考

叉烧ZBayes CS的陋室 2022-08-08

过年啦,感谢大家一年来的支持和鼓励。祝大家新春快乐,阖家幸福,万事如意,身体健康!一首“将军令”送给大家,希望大家都能做自己生活的“将军”!

2016年10月份,我开启了自己的公众号。当时自己刚保了研,时间一下子松了很多,以为自己能尝试做更多自己的事,希望结合自己在组里做的内容,分享分享自己的东西,同时交交朋友,互相交流。可惜事与愿违,自己并没有因此而闲下来,自己的推文思路也迟迟没有定下来,前端的有,数据挖掘之类的都有,一个原因是组里的工作就是两个方向,另一个是因为自己并没有定下来,直到去年年末,我才最终决定自己的最终方向——数据科学,自己的公众号的方向才慢慢开始稳定下来。总结了一下,从开发至今,共推送105条,篇均阅读量不足50,相比很多同期的个人公众号而言,这个算是非常少的,自己也思考了很多原因,感觉自己的内容确实比较不那么亲民,质量还有待提高。后面我会继续探索,了解大家关心的内容,与时俱进,多写一些好东西进行分享。虽然前端我目前还有在做,但是未来我的大方向还是数据科学和数据挖掘,所以后面我会继续更新数据科学相关的内容,欢迎大家继续关注,也欢迎大家转发分享。

关于我的具体内容和方向,可以参考这几篇文章。

数据科学和很多学科一样,就是一个需要学习、需要深入的学科或者方向,对初学者,2018年的建议有这几个:

  • 代码。无法避开,要实现模型解决问题,代码基本都绕不过,而且对数据科学而言,代码其实并不困难。小白推荐python和R,好入门的同时,社区齐全,功能完善。

  • 沉下心学习。现在都说大数据,各种火,但是很多人的心很浮躁,妄图几天就学会,花几天就能落地实现,不存在的,必须静下心的读书、学习、看论文、看源码、动手试试你才会有进步,才会有所得。

  • 完善自己的技能树。数据科学与数据挖掘是一个交叉性比较强的学科,良好的数学基础和较高的技术水平都是入行的必要条件,公式推不了,代码写不好的,很难做一些事情,不要为了蹭热度以为上了车就能通往人生巅峰,不存在的。对于技能树里面该有的东西,可以看我的数据科学家必备技能(硬件篇)数据科学家必备技能(软件篇)这两篇文章。

  • 多动手。站在岸上学不会游泳,光看书和学习是绝对不行的,学习最终的目标都是为了用,在闲暇之余,多动手做一些项目,网上很多实战,例如垃圾邮件分类、泰坦尼克生还者分析、离职员工预测等,甚至是大学生的建模竞赛,其实都是很适合练手的项目,网上也有很多人的分享,尝试做做无妨。不要觉得简单就不做,因为你动起手来,才知道你自己很多东西都不会。

  • 多百度。只要合法,符合道德,没有什么问题是百度解决不了的,如果有,那就淘宝。很多你遇到的问题就是很多人遇到的,所以一般会有人写经验,多查查看看就好。别遇到啥都去问人,大家都有事情忙,不是都有时间回,互相理解一下,有时候可能会伤感情,很难受。

  • 不要怕看英文。可能很多人看到英文会绕道走,这是绝对不行的!!大部分人都学了不短时间的英语了,大胆尝试看看,很多东西其实没那么难,加上现在翻译工具这么多,百度翻译,谷歌翻译等,都很靠谱,所以不要害怕看,是好东西就别浪费了。

  • 问题导向。包括我在内,技术或者方法很多,所以总想着从方法出发去找问题,这样很难有明确的发展方向,要让项目落地,实施,盈利,那就要找到正确的、确实存在的、有希望解决的问题,然后才是方法,俗话说方法总比问题多嘛。这只是一种思维方式,但是不见得方法导向就是错的,毛主席说过——实事求是。

  • 谨慎对待深度学习。深度学习只是众多解决问题的方法之一,但并不是唯一的。深度学习是一个能让结果提升很快的一种方法,结果是真的好,但是由于深度学习的黑箱的原因,如果一遇到问题首先就上深度学习,很多关于问题深层次的性质你就无法发现,调试模型或者是分析的时候,就没有很好的结果。这点我后面会专门写文章探讨这个问题。

2017年,感谢父母对我无微不至的照顾,感谢导师的谆谆教诲,感谢2018对我来说很重要,是我的一个转型期,科研上,工作上,生活上都有十分重要的事情,所以我会继续按照这个努力的节奏继续下去,希望大家也不要放松步伐,持续前进。

最后,再次祝愿看到这篇文章的,没看到这篇文章的大家在新的一年,心想事成,万事如意!2018,我们一同进步。

有什么欢迎留言,我们聊聊,另外最近打算求职,各位大佬如果看得起小生,感谢收留。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存