大部分数据科学课程没有教给你的内容
今日份知识你摄入了么?
虽说世界上没有完美的数据科学课程,但你知道大多数课程没有教给你是什么吗?
是你在工作中需要的但又不那么明显的技能和工具!
图片由Frank Andrade授权给Shutterstock
大多数数据科学课程都可以很好地帮助你开始学习编程语言,并刷新你已有的数学和统计知识,但它们缺乏几个专门针对你在工作中所需技能的模块,这些技能将帮助你与其他数据科学家一起高效地工作,并让非数据科学家也可以理解你的工作。
以下是你可能在数据科学课程中没有学到的三件事。
软件工程实践
作为一名数据科学家,你将使用SQL、Python和R等编程语言编写代码,大多数数据科学课程会帮助你开始学习编码,但它们不会教你如何专注于良好的实践。
诸如编写干净代码、模块化代码以及如何优化代码等良好实践在软件工程中非常流行,相信我,这些好的实践将帮助你成为一个更好的数据科学家。
这里有一个简单的例子可以说明写干净的代码的意思:
# Imagine we want to write a program that categorizes a task based on its execution time
# Below are two ways of writing this code (one is more clean than the other)
# bad
t = end - start_time # get execution time
c = category(t) # get category of task
print(f'Task Duration: {t} seconds, Category: {c}')
# good
execution_time = end_time - start_time # get execution time
category = categorize_task(t) # get category of task
print(f'Task Duration: {execution_time} seconds, Category: {category}')
这是一个只有几行代码的基本示例,脚本越长,遵循这些良好实践就越重要。
如何学习良好的软件工程实践?
你可以搜索指南或教程,学习数据科学的良好软件工程实践,并阅读一本涵盖所有这些要点、并给出该主题总体概况的书。
我特别建议你去看看“Clean Code in Python”这本书,因为它涵盖了前面提到的大部分要点。
讲故事和沟通技巧
数据科学课程通常教你如何使用Python或其他工具创建可视化。他们有时甚至会提供给你一些建议去完善你的图像美观性,然而,他们并没有培养你能够有效地向他人解释见解的沟通技巧。
沟通技巧非常重要,因为数据科学家不仅与其他数据科学家合作,还与没有技术背景的受众和同事合作。如果你试图用技术词汇和行话向非数据科学家解释事情,他们很可能听不懂你说的话。相反,如果你能用通俗易懂的英语解释你的观点,大多数人都会理解你的意思。
为了更好地交流你的想法,你不仅需要良好的可视化,还需要出色的叙述,并充分利用你的数据。这就是讲故事的艺术!
图片来源于作者
如何培养良好的沟通技巧和学习讲故事?
要成为一个好的沟通者,你需要向最好的沟通者学习。如果你查阅“有史以来最好的沟通者”,你会发现像Bill Clinton、Oprah Winfrey和Ronald Reagan这样的优秀沟通者。你可以选择他们中的一个或任何其他你非常喜欢的交流者,然后观看他们的一些演示,看看是什么让他们这么优秀。
另一方面,也有学习讲故事的好书。在本文中,我将谈论一本名为《用数据讲故事:商业专业人士的数据可视化指南》(Storytelling with Data: A Data Visualization Guide for Business Professionals)的书,它将帮助你使用讲故事的力量轻松解释任何概念,并让人们参与到你的演示中来。在本文中,你还可以找到一本书,其中介绍了我最喜欢的一个沟通者的演示秘密。
协作工具
作为一名数据科学家,你将在一个大型项目的团队中工作。这意味着你将使用不同的工具与团队成员协作,使工作更高效。
你需要熟悉的工具之一是Git。
Git是一个版本控制系统,它允许我们在不破坏代码的情况下对代码进行调整和跟踪更改。有了Git,我们可以返回过去,创建新的独立分支等等,因此多个数据科学家可以一起工作,而不相互干涉。
图片来源于作者
大多数数据科学课程不教授像Git这样的版本控制系统的原因是,它们专注于培养你作为个人的数据科学技能,而不考虑你在团队中工作时可能遇到的问题。
团队用于协作的工具不胜枚举,所以你应该看看你所在的公司都使用了哪些工具,Git、GitHub和Tableau是最受欢迎的几个工具,非常值得学习。
原文作者:Frank Andrade
翻译作者:过儿
美工编辑:过儿
校对审稿:明慧
原文链接:https://medium.com/geekculture/heres-what-most-data-science-courses-don-t-teach-you-b681021a247
本周公开课预告
往期精彩回顾
点击“阅读原文”查看数据应用学院核心课程