想转行数据科学,你需要做什么?
今日份知识你摄入了么?
2018 年初,我真的很想成为一名数据科学家。我认为这个职位听起来很厉害,构建“机器学习模型”听起来很酷,还非常热门。
如果我上面的观点让你产生了共鸣,那么我鼓励你继续读下去。
经常有人问我,一个人如何才能从会计或化学工程等完全不相干的行业转行到数据科学?
关于这个问题我想了很多。第一,当我想要进入数据科学领域时,我也经常问自己这个问题。第二,因为我认为大家对数据科学存在很大的误解——这也是本文的主要目的。
摄影:Markus Winkler 图源:Unsplash
所以我想谈谈关于数据科学的一些真相。
1. 并非每个数据科学家都从事“数据科学”工作
“数据科学”这个术语涵盖技能和工作职责非常广泛,所以,一家公司的数据科学家可能和另一家公司的数据科学家完全不同。从我的经验来看,几乎没有数据科学家会把所有时间都花在构建机器学习模型上。许多数据科学家还会扮演数据工程师和数据分析师的角色。
2. 并非每个从事“数据科学”工作的人都拥有数据科学家的头衔
另一方面,我认识很多数据分析师和数据工程师,他们从事数据科学项目,例如预测模型、异常检测模型和推荐系统。
综上,你可以从中得到一些启示:
1. 想想你对数据科学家角色的哪一部分感兴趣,而不是只考虑职位本身。你喜欢构建机器学习模型这个想法吗?你想钻研统计学世界吗?现在,我意识到,虽然我最初想成为一名数据科学家的理由可以理解,但这种想法也让我一开始就抱着错误的心态——意识到这一点,也会给你的职业生涯提供更多方向,使你的职业生涯变得更加有意义。
2. 任何与数据相关的工作都是进入数据科学领域的良好开端。除了寻找“数据科学”工作之外,我还建议查看商业分析师、数据分析师职位、Python 开发人员职位、产品分析师职位等,因为你需要不停地提高核心数据科学技能,如 SQL 和 Python,同时也能为你自己创造许多机会。
下一步是什么?做一个项目。
如果你弄清楚了你对数据科学地哪一部分兴趣,接下来要做的就是做一个自己的项目。我个人认为,完成个人项目的价值是完成在线证书的 100 倍,因为它可以让你更好地为数据科学家的实际工作做好准备。
我也明白,构想出一个项目理念可能很难,所以,下面我会提供给你一些我的个人想法:
如果你是一名篮球迷,你是不是可以收集数据,看哪些因素最能反应球队即将赢得比赛?是三分命中率最高的球队吗?是主场球队吗?等等…
如果你喜欢烹饪,是不是可以找食谱的数据集(或收集自己的数据)并创建一个模型,补充缺少的内容。
如果你想钻研深度学习的世界,你可不可以创建模型来检测某人是否戴口罩?
如果你还没有准备好做自己的项目……
如果你还没有准备好做自己的项目,以下步骤也可供你在实际操作中使用,你可以用来指导自己的学习:
1. 从学习统计学开始
我认为统计学非常重要,因为大多数机器学习概念和数据科学应用都围绕着统计学展开。如果你不喜欢统计学,那数据科学可能不适合你。
2. 学习 Python 和 SQL
你可以学习Python和SQL。如果你更喜欢 R 语言,那也可以继续,先我个人并没有用过R语言,所以我无法发表意见。但是,你越擅长使用 Python 和 SQL ,在数据收集、操作和使用方面就越容易。也要慢慢熟悉 Pandas、NumPy 和 Scikit-learn 等 Python 库。我还建议你了解二叉树,因为它是许多高级机器学习算法(如 XGBoost)的基础。
3. 学习线性代数基础
当你处理矩阵的项目时,线性代数尤为重要。线性代数经常出现在推荐系统和深度学习应用中。如果你对这些内容感兴趣,请不要跳过此步骤。
4. 学习数据操作
数据操作至少占数据科学家工作的 50%。更具体地说,你需要了解更多有关特征工程、探索性数据分析和数据准备的信息。
感谢阅读!
我希望我的这些见解可以帮到你!虽然这篇文章有很多个人观点,但我觉得很多人都会同意本文关于数据科学家的两个事实:
1. 并非每个数据科学家都从事“数据科学”工作
2. 并非每个从事“数据科学”工作的人都拥有数据科学家的头衔
希望你一如既往地在学习中取得优异成绩!:)
原文作者:Terence Shin
翻译作者:Lia
美工编辑:过儿
校对审稿:Jiawei Tong
原文链接:https://towardsdatascience.com/heres-the-honest-truth-about-making-a-career-switch-into-data-science-2e5a42d24879
本周公开课预告
往期精彩回顾
Facebook和Microsoft数据科学家面试,他们会问这些SQL问题
点击“阅读原文”查看数据应用学院核心课程