查看原文
其他

和生意人打交道,数据科学家常犯的三大典型错误

2017-07-24 爱玲 大数据应用

目前还没有一家媒体的封面文章宣扬过那些不符合舆论预期的数据科学家的失败。

今天我们就来谈谈数据科学家常犯的三大典型错误以及如何避免犯这些错误。


数据科学家的工作是解决各种各样的问题,但是有的人就是无法解决。他们要么是不知道“如何解决”,要么就是太痴迷于纯粹技术的部分而缺乏对其工作的全局性了解。有的数据科学家还会为他们的老板会在他们正致力于某些“真正重要而复杂”的工作时要求他们做一些“简单又琐碎的数据任务”感到沮丧。数据科学家在职业道路上失败的原因不计其数。接下来,我将总结出三大最致命的错误。

1

 Less communication is better 认为多说无益

我所见过的出色的数据科学家他们首先是优秀的交流对象,其次才是天才的数据极客。数据科学家常犯的一个错误就是不计代价地远离生意人。也就是说,他们会为了专注于做那些“酷炫的极客任务”而尽最大努力避免和生意人打交道。毋庸置疑,我热爱我工作中那些带有极客性质的部分,这也是我会进入这一行业的首要原因。但我们是被录取进入公司来解决问题的,问题的解决必须要求充分的沟通。


数据科学家必须跟踪他们的数据分析进度,并且始终收集同事的反馈意见,特别是当他们没有找到任何特别的东西的时候 - 也许这是个好消息?重要的不仅是收集反馈意见,而且还要根据反馈调整分析和假设。这就是“数据科学”中的“科学” —— 科学方法是建立在基于新的数据来重新定义假设理论的原则基础之上的而且,收集和解读新数据的唯一方法是与定义了最初的假设理论的人,也就是你的老板,进行沟通。

2

   Delaying simple data requests from business teams 

   轻视业务团队的简单数据请求

这简直就是经典的吐槽——让数据科学家抓狂只需要一些简单的数据方面的请求(“见鬼!这就仅仅30行SQL代码而已!”)就是在这一点上,许多数据科学家开始走向失败。尽管对于科学家来说,数据已经可用而且能够解决多年的问题,是显而易见的,数据科学家们还是倾向于像个工程师一样思考(“相信我,我是一个工程师”)并且尝试着去建构可扩展框架以支持长期解决方案。


但是,商人们可不在乎什么架构、规模、工程,他们只在意洞察力和可操作性的见解。如果你不能够提供他们所需要的这些,你在他们眼中就是失败的。而且,他们是做销售的,所以他们的决定往往是差之毫厘,失之千里的。如果你不能够帮助他们最优化他们的决策,那你对他们来说就是沉没成本的一部分,金融理论中对于商人来说相当鸡肋的那部分。所以,不要忽视这些简单的要求。首先你得确定这些简单的要求是用以支持某些能够通过数据分析来改善的业务决策的,然后请你咽下你的骄傲,埋头处理那些微不足道的30行SQL代码,这样你就能从公司的沉没成本转变为具有高投资回报率的一个重要部分。

3

  Preference for complex solution over easy one

  偏爱复杂的解决方案

最后的这个是最昂贵的错误,实际上也是对于数据科学家来说最重要的准则。将数据科学家描述为能够写代码、算数学、做统计以及远比其他人更了解业务的终极天才其实对数据科学家来说是非常不利的。这种期望逐渐发酵以致使数据科学家认为他们需要通过应用顶尖的统计学和计算机科学方法来解决问题。


最终,你会遇到一个这样的情况:因为行业使他们痴迷于复杂性,初级数据科学家认为一切都可以通过深度学习来解决,而不知道如何进行初级的数据探索 。基础数据探索和可视化是数据科学家的主要工具,这决定了你需要将大部分时间用来探索数据。不建立机器学习模型 - 除非你被雇用专门做这个。不构建扩展的后端架构。不要为一个简单的业务问题写一个10页的深入假设检验研究。除非你被雇用或被特别要求这样做。您的主要作用是探索可行的见解,并将其分享推荐给你的老板。

 

不要因为那些泛滥的迷信将本就已经相当复杂的领域进一步复杂化。当数据科学家想要把机器学习应用到每一个用例、每一个项目时,那就是这种错误的典型示例。这不仅减慢了所需输出的传送速度,而且在许多情况下其实根本就不需要机器学习模型!正如我之前解释的 – 如果数据科学家的核心工作是要解决问题,没有必要处处应用那些时髦的新工具。

 


So how do I succeed as a data scientist?

那么,要怎样才能成为一名成功的数据科学家呢?


与每个领域一样,实现成功或不幸失败都有很多具体的原因。有些错误是需要栽过跟头后才能了解个中本质,而有些根本的经验教训完全可以不需要经过试错就能懂得的。最重要的是你要热衷于问题本身,热衷于为你的老板构建解决方案,而不是痴迷于工具和那些天才极客式的东西。 除非你的角色是一个完全不需要与其他人交流的工程师,否则你就必须学会与人沟通交流,并且要耐心运行那些简单的——或者说在你眼中极其微不足道的——提供毫无吸引力的3×3数据表的代码。你要知道,有时简单是更好的,这是所有事物的基础 ——

 

“everything should be made as simple as possible, but not simpler” as one pretty famous scientist Albert Einstein once said.


“一切都应尽可能简单,而不仅仅只是稍微简单一点”   正如著名科学家爱因斯坦曾经说过的那样。


文章来源 / KDNuggets

原文作者 / Karolls Urbonas

编辑 / 珺妹妹


12

数据应用学院

数据应用学院(Data Application Lab), 北美第一家培训-项目实习-职业辅导-内推一站式专业数据人才输送机构,提供大数据和数据科学培训和公司项目解决方案,由南加州与硅谷的高级数据科学家与数据工程师联合创办,致力于传播数据行业最新应用和知识、培训及输送优秀大数据人才,以填补人才缺口、充分发挥大数据在商业中的力量。2016年被北美著名科技杂志Tech Beacon评为Top Data Camp。 





 长期招募 

TECHNICAL WRITER/翻译志愿者  

  1. 职责:

    1. 深度讨论数据应用

    2. 调研行业发展

  2. 要求:

    1. 对数据应用极为感兴趣

    2.  具备数据分析基础

    3. 具有一定BUSINESS INSIGHT

    4. 写作能力强

感兴趣的同学发送简历writing samplehr@dataapplab.com,邮件标题“申请翻译/Technical Writer”。

往期文章内容


想要和数据应用学院有更多直截了当的交流

欢迎根据个人需求 扫码入群


点击“阅读原文”查看数据应用学院核心课程

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存