查看原文
其他

四个数据科学求职者的常见失误

Lea 大数据应用 2022-10-18

今日份知识你摄入了么?

在过去12个月里,我们帮一个公司的数据科学团队雇佣了大约10个新的数据专业人员。从实习生到高级职位,你能想到的各类申请数据分析师和数据科学家工作的个人简历都有。



从这些求职者身上,我学到了很多东西,也希望能教会他们一些新东西。在整个过程中,我发现了那些没有成功通过面试的求职者的一些共同点。


马斯洛锤(The Maslow’s Hammer)


在对求职者进行技术评估时,我从来没有要求过他们必须使用哪一种工具或编程语言来解决问题。因为我认为,在选择上保持一定的开放性,候选人才能用他们的创造力和实验来测试不同的方法。在大多数情况下,这是很有效果的,不过有时刚好相反。


图源:Moritz Mentges


好多次,应聘者都想用一种解决方案来解决所有的问题。一旦失败,就说自己没有办法解决这个问题。就像大家认为,每个聚类问题都可以用K-means解决;或者如果不能用Facebook的Prophet创建一个模型,就没有办法预测时间序列;再或者,简单地认为每个问题都可以用机器学习来解决。


那要如何解决这个错误?你需要关注的是问题本身,而不是目前正在使用的工具。可能每天都会有人要求你给出“一个解决这个问题的人工智能”和“一个预测这个问题的模型”;但你的要问的问题,不是“我应该使用哪种算法?”,而应该是“他们想解决的问题是什么呢?”


出色的代码技能,糟糕的沟通能力


有时候(事实上大多数时候),我们需要把一个技术概念解释给一个非技术人员听,这并不是件容易事。但不管是解释度量的计算,还是模型的预测,其实,我们的大部分工作都是在沟通。



有时,利益相关者大都是外行。所以就需要我们找到跟他们之间共同的交流方式。


在一些应聘者中,我有注意到他们的技术很好,但传达出的效果总是不那么理想。而且,当我们问一些业务人员通常会问的问题,比如解决某个问题的方案时——他们总是抓不住要点,也没有办法解释为什么他们会选择这种特定方法。


如何解决这个问题:在选择解决方案之前,理由必须要充分,可以参照基准、以前的经验或实验——比如,你可以说“在测试的解决方案中,这个更好,因为ABC”。另外,还要了解你的解决方案存在的缺陷、缺点以及改进的方法。


杂乱的交流


这个话题基本上是上个问题的延伸。他们沟通失败的很大一个原因是,他们总想尽可能多地用编程来解决问题,而忘了讲故事。更夸张的是,我还收到一些的评论,他们把camelCase和snake_case代码混合在一起;还混合了不同的语言的注释等等。虽然,不能以此为标准淘汰某位应聘者,但这充分表明他缺乏一定的严谨性。


大多数情况下,缺乏讲故事的能力是指:应聘者在交替使用代码时,没有解释他们所用的方法。很多公司会先进行技术测试,然后再与团队初步对话,事实上,到这一步就决定了你是淘汰还是进入下一轮。


如何解决这个问题:从StackOverflow复制代码没问题,就连我自己一天也得做几次。但是,你必须要保持清醒,而且时刻提醒自己讲一个好故事。对于“好的代码不需要评论”这种想法,我持保留意见,当我们谈到数据科学家和数据分析师的工作时,像jupiter notebook这样广泛用于招聘流程的工具,给我们提供了一些不同寻常的东西:把故事与代码合并的可能性。


不知道公司是做什么的


这可能是求职者们会犯的一个最大错误,特别是对于那些申请数据科学职位的人来说。在这里,并不是说你需要了解公司的全部,但你至少应该知道,这家公司是做什么的。你可能会问,为什么这很重要?



去很多公司面试,你都会面临同样的问题。你会担任一个与业务相关的职位,了解公司是如何赚钱,主要竞争对手是谁,商业模式是什么,这是你与其他人竞争时突出优势的最起码的方法。

原文作者:Paulo Vasconcellos

翻译作者:Lea

美工编辑:过儿

校对审稿:Jiawei Tong

原文链接:https://towardsdatascience.com/the-4-biggest-mistakes-of-data-science-job-applicants-20e67fdd0d0a

本周公开课预告



往期精彩回顾


东京奥运接近尾声:Data Analysis在体育行业有哪些应用以及工作机会?

六个月零基础入行数据科学家,我做对了哪些事?

7周时间硅谷大牛带你免费学推荐系统!8月数据科学读书会直播讲座报名中~

基于云端的数据仓库的优势





点「在看」的人都变好看了哦

点击“阅读原文”查看数据应用学院核心课

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存