查看原文
其他

大部分数据科学课程没有教给你的内容

过儿 大数据应用 2022-10-18

今日份知识你摄入了么?

虽说世界上没有完美的数据科学课程,但你知道大多数课程没有教给你是什么吗?

是你在工作中需要的但又不那么明显的技能和工具!


图片由Frank Andrade授权给Shutterstock


大多数数据科学课程都可以很好地帮助你开始学习编程语言,并刷新你已有的数学和统计知识,但它们缺乏几个专门针对你在工作中所需技能的模块,这些技能将帮助你与其他数据科学家一起高效地工作,并让非数据科学家也可以理解你的工作。


以下是你可能在数据科学课程中没有学到的三件事。


软件工程实践


作为一名数据科学家,你将使用SQL、Python和R等编程语言编写代码,大多数数据科学课程会帮助你开始学习编码,但它们不会教你如何专注于良好的实践。


诸如编写干净代码、模块化代码以及如何优化代码等良好实践在软件工程中非常流行,相信我,这些好的实践将帮助你成为一个更好的数据科学家。


这里有一个简单的例子可以说明写干净的代码的意思:


# Imagine we want to write a program that categorizes a task based on its execution time# Below are two ways of writing this code (one is more clean than the other)# badt = end - start_time  # get execution timec = category(t)  # get category of taskprint(f'Task Duration: {t} seconds, Category: {c}')# goodexecution_time = end_time - start_time  # get execution timecategory = categorize_task(t)  # get category of taskprint(f'Task Duration: {execution_time} seconds, Category: {category}')


这是一个只有几行代码的基本示例,脚本越长,遵循这些良好实践就越重要。


如何学习良好的软件工程实践?


你可以搜索指南或教程,学习数据科学的良好软件工程实践,并阅读一本涵盖所有这些要点、并给出该主题总体概况的书。


我特别建议你去看看“Clean Code in Python”这本书,因为它涵盖了前面提到的大部分要点。


讲故事和沟通技巧


数据科学课程通常教你如何使用Python或其他工具创建可视化。他们有时甚至会提供给你一些建议去完善你的图像美观性,然而,他们并没有培养你能够有效地向他人解释见解的沟通技巧。


沟通技巧非常重要,因为数据科学家不仅与其他数据科学家合作,还与没有技术背景的受众和同事合作。如果你试图用技术词汇和行话向非数据科学家解释事情,他们很可能听不懂你说的话。相反,如果你能用通俗易懂的英语解释你的观点,大多数人都会理解你的意思。


为了更好地交流你的想法,你不仅需要良好的可视化,还需要出色的叙述,并充分利用你的数据。这就是讲故事的艺术!


图片来源于作者


如何培养良好的沟通技巧和学习讲故事?


要成为一个好的沟通者,你需要向最好的沟通者学习。如果你查阅“有史以来最好的沟通者”,你会发现像Bill Clinton、Oprah Winfrey和Ronald Reagan这样的优秀沟通者。你可以选择他们中的一个或任何其他你非常喜欢的交流者,然后观看他们的一些演示,看看是什么让他们这么优秀。


另一方面,也有学习讲故事的好书。在本文中,我将谈论一本名为《用数据讲故事:商业专业人士的数据可视化指南》(Storytelling with Data: A Data Visualization Guide for Business Professionals)的书,它将帮助你使用讲故事的力量轻松解释任何概念,并让人们参与到你的演示中来。在本文中,你还可以找到一本书,其中介绍了我最喜欢的一个沟通者的演示秘密。


协作工具


作为一名数据科学家,你将在一个大型项目的团队中工作。这意味着你将使用不同的工具与团队成员协作,使工作更高效。


你需要熟悉的工具之一是Git。


Git是一个版本控制系统,它允许我们在不破坏代码的情况下对代码进行调整和跟踪更改。有了Git,我们可以返回过去,创建新的独立分支等等,因此多个数据科学家可以一起工作,而不相互干涉。


图片来源于作者


大多数数据科学课程不教授像Git这样的版本控制系统的原因是,它们专注于培养你作为个人的数据科学技能,而不考虑你在团队中工作时可能遇到的问题。


团队用于协作的工具不胜枚举,所以你应该看看你所在的公司都使用了哪些工具,Git、GitHub和Tableau是最受欢迎的几个工具,非常值得学习。

原文作者:Frank Andrade

翻译作者:过儿

美工编辑:过儿

校对审稿:明慧

原文链接:https://medium.com/geekculture/heres-what-most-data-science-courses-don-t-teach-you-b681021a247

本周公开课预告

往期精彩回顾

高盛开启大规模裁员,华尔街凛冬将至?

决策树剪枝101

SQL & NoSQL,掌握这7点就够了

快速上手Pandas数据结构合并

Meta并不是唯一青睐VR人才的公司





点「在看」的人都变好看了哦

点击“阅读原文”查看数据应用学院核心课程

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存