数据科学家应树立的新年追求
海归学者发起的公益学术平台
分享信息,整合资源
交流学术,偶尔风月
新年伊始,正是为自己树立新目标的最佳时机。数据科学家近年日趋火热,诸多领域都有所需求。倘若你正在朝此方向迈进,那么如何努力才能让自己不断升级呢?我们针对不同层次,给出“任务清单”。如果你可以认真执行,相信2016年一定会有所突破。但是要记住,成为数据科学家是一个循序渐进的过程,请保持耐心。
何为初级呢?如果你对分析学和数据科学基本陌生,不了解这个行业如何运作,在考虑是否以此作为自己的方向……那么没错,从这里读起吧。
1. 从一门编程语言开始: R或者Python
很多学生都试图同时学习R和Python,但最终两者兼不得顾。这个方法很不可取,你必须想清楚到底要学习R还是Python。它们都是开源工具,在各大公司应用广泛。Python可以说是最容易上手的编程语言,R同样是广受钟爱的统计工具。两者基本相当,选择权在你的手里。
2. 掌握统计学和数学
如果你想在这个领域里前行,那么统计学与数学就是你的双腿。统计学无非逻辑和数列;你的数学如果不强,也不必气馁,好好掌握最有用的统计方法、代数和概率吧。网上可以找到很多优秀相关课程。
3. 每次只参加一项在线课程 (难)
MOOCs已成为很多人热衷的学习方式。但最难的是,很多人常常同时参加多项课程,渴望齐头并进,结果一门都没有完成。所以,一定要把精力集中在一门课程上,完成一门再开始下一门。
4. 接触行业
我们生活在一个日新月异的时代,你需要知道数据分析领域都在发生什么。搞不好今天还在流行的技术,明天就被淘汰了。尽量多与那些专业人士交流,与未来的自己对话。可以尝试参与讨论活动、参加聚会、订阅博客、加入小组、阅读书籍等等。
哪些人属于中级水平的数据科学家呢?如果你完成了上述内容,对机器学习的基本原理做过实践,掌握了如何建立预测模型,那么你已经达到中级水平了。不过,完成这一阶段需要有坚定的决心,并花费大量时间进行练习。你是否做好了准备?
1. 理解并积累起机器学习技能
机器学习是数据科学与技术的未来方向。几乎所有大公司都投入了大量资金雇佣擅长此项技能的员工。人才需求巨大,对每个从业者来说,这也是崭露头角的绝佳机会。今年,你应该进一步提高自己在机器学习上的深度了。具体请掌握聚类分析 (Regression)、回归分析 (Clustering) 以及决策树 (CART)。
2. 重点放在组合算法与提升算法
一旦你在机器学习上找到了自信,那么应该再进一步了。通过组合方法 (Ensemble) 与提升方法 (Boosting),你可以建立出相比其他算法精确很多的模型。这方面的学习资源不少,但一定要保证自己真正掌握了这个内容。
3. 摸索Spark、NoSQL以及其他大数据工具
今年,你该研究下大数据了。鉴于目前行业对大数据专家需求高涨,你一定要学的是Spark。最近它非常流行,广泛用于数据挖掘和机器学习,大数据的未来非它莫属。除此之外,你还可以看一看NoSQL、Hadoop等工具。
4. 传道授业解惑
还有什么事比分享知识更有意义呢?走到现在,你已经可以开始为那些仍在数据科学之路上纠结的小伙伴们指点迷津了,要相信自己!你可以加入数据科学的论坛,回答问题,为别人传授技巧和技术;还可以在周围圈子里组织线下聚会。这绝对是互惠互利的事。
5. 参加数据科学比赛
是时候测验下自己的本领了。新的一年里,你不妨参加些比赛。这不仅能帮你看清自己的长处和弱点,还可以让你就所掌握的内容获得更多自信。如果可能,挤进Kaggle排行榜500强数据科学家将是非常有益的。
对这部分人我已无需定义。他们所掌握的数据科学是大多数人怯于尝试的。他们的水平使其处处游刃有余,不过他们仍然喜爱挑战。对于这些身经百战的专家,请参考以下建议。
1. 建立深度学习模型
今年,你应该为那些渴望成为数据科学家的人们建立一个榜样。你要督促自己争取建立一个深度学习模型,一些业内人士已经在用其进行预测工作了。这是机器学习的更高阶段,其精确性显然优于一般的机器学习模型。
2. 回馈大众
我们的知识应与人分享。你分享的越多,学到的也就越多。有这样的说法,如果你学习了一个新概念,并把它解释给你的两个朋友,那么你对这个知识会掌握得更加牢固。今年,资深的你也应为自己设立这样的目标,用你的经验和知识帮助更多的人。对于那些正在挣扎中的朋友来说,这无疑是雪中送炭。
3. 探索强化学习
在机器学习领域中,强化学习 (Reinforcement Learning) 是目前最为强大却仍欠开发的方向。今年,请要求自己在这一领域做一下研究。这必然是一个挑战,但值得努力。无人侦察机和无人驾驶汽车都是强化学习带来的产物。一旦你进入这个领域,那么你已经是在研究人工智能了。
4. 目标Kaggle排行榜50强
新的一年,你要督促自己在Kaggle榜单上保住“大师”地位。准确地说就是在排行榜上成为前50位的数据科学家。参加那些最适合你知识体系的比赛,与其他Kaggle学者共同协作。在这一级别的比赛中,你将学到在任何地方都无法学到的内容。
最后想说的是,尽管列出了这一大串清单,大家还是要脚踏实地去努力。千里之行,始于足下。
原文链接
http://www.analyticsvidhya.com/blog/2015/12/special-year-resolutions-data-scientist/
点击以下链接,阅读近期热文
本文由知社原创编译,转载请联系授权
喝茶聊天心有灵犀,钻研切磋触类旁通
论文技巧,基金攻略,大家访谈,高黑科技
回复“目录”或“分类”,浏览知社更多精华。长按二维码识别,可以关注/进入公众号进行回复。