查看原文
其他

数据科学家订阅ChatGPT三周体验:每天节省3小时工作时间!

数据应用学院 大数据应用 2023-08-17

今日份知识你摄入了么?

图片来自Unsplash,作者Jonathan Kemper


ChatGPT作为NLP的强大人工智能工具,最近获得了巨大的人气。它接受了大量数据的培训,包括书籍、文章和网页,这使它能够对任何文本提示生成连贯和有洞察力的响应。换句话说,你可以简单地向ChatGPT提出任何问题,从想法的产生到代码的实现,你会找到一个答案或至少一个想法来解决你可能遇到的问题。


我是ChatGPT的用户已经有几个星期了,可以告诉你我的工作效率有了显著的提高。ChatGPT已经被证明是像我这样的数据科学家在改善我的工作流程、通过减少在谷歌上寻找bug解决方案的时间来提高生产力和简化我的工作流程方面的有效工具。这给了我更多的时间来做决定。


产生一些想法和/或假设


作为一名数据科学家,我花了相当多的时间从利益相关者那里理解问题,并集思广益如何使用数据解决问题。


集思广益的过程可能需要一些时间,但这是绝对必要的。正如人们所说,“如果你能把问题清楚地写下来,问题就解决了一半”。


我在工作中解决的问题之一是客户流失。以下是ChatGPT建议我做的事情:



虽然这不是一个直接的答案,但人们肯定可以获得一些关于如何开始收集数据和建立相关模型来解决面临的问题的想法。你可以进一步要求ChatGPT提供此代码:



我确实开发了一个用户流失模型和“重复频率”货币分析,以细分客户并分析用户流失行为,结果非常棒,我们公司成功地将留存率提高了20%。


建立一个数据科学组合


或者,如果你正在一家科技公司寻找一份新工作,而你不确定在你的投资组合中包括什么项目来帮助你从其他人中脱颖而出并获得面试机会,你可以向ChatGPT询问一些项目想法。


以下是应用于Tiktok的项目想法的一个例子:


你甚至可以问ChatGPT为你准备一个职业路线图。这将节省你在网上寻找相关项目的时间。


获取SQL帮助


对于数据科学家来说,知道如何查询所需的数据是必须的。在这里,我假设数据工程师已经通过他们的管道处理了数据,现在可以进行查询。


我只使用了几年的SQL,所以我不会说我是一个SQL专家。有时,我可能需要参考Stackoverflow的一些语法来处理复杂的窗口函数,如LAG()/LEAD(), NTILE(), DENSE_RANK()等。


使用ChatGPT,我可以简单地输入模式和需要查询哪些数据的需求。这样我就能在瞬间完成工作。



将Python代码转换为其他语言


ChatGPT可以做的很酷的事情之一是将代码转换为其他语言。在一个由数据科学家和软件工程师组成的技术团队中,能够用开发人员的语言编写代码有时是有帮助的(尽管这不是强制性的,因为人们可以编写一个API,以不同的语言嵌入模型)


我也做了相反的事情,要求ChatGPT将JS代码转换为Python,只是为了让我理解代码是如何工作的。


创建的数据可视化


我容易忘记的Python代码之一是seaborn和matplotlib来实现数据的可视化。


以前,我总是在Python上保存一些重要的可视化模板的备忘单,以便每当我需要可视化一个数据集时,我总是可以快速地将其编码出来。


使用ChatGPT,我现在可以在几秒钟内快速编码出许多可视化的图,而不需要再参考我的帮助表。以下是一些例子:



显然,我的工作变得更有成效了。我能够在工作中提供更快的结果 :)


优化代码的内存和速度


ChatGPT已经被证明是一个非常有用的工具,可以改进和优化代码的内存和速度。以下是我尝试过的方法:


1. 优化python中的循环



这在使我的代码更高效,干净和“python”方面帮助了我很多。


2. 为给定的问题找出最好的算法


通过输入问题陈述和数据类型,ChatGPT可以提供关于如何优化算法或如何决定哪种算法将是最有效率和效果的建议。



这为我节省了很多评估ML模型的时间。虽然这不是详尽的,但它为数据科学家提供了一份清单(以防我们忘记),说明我们如何改进模型。


将见解传达给利益相关者


在花费时间构建模型后,数据团队准备将其部署到生产中,并希望该模型能够提高该组织定义的某些关键指标。


例如,部署一个客户流失模型,以检测谁将流失以及何时可能发生流失,使团队能够采取行动,尽量减少流失率。


然而,要实现这一点,数据团队必须解释他们使用的模型是什么,以及这如何移动针。换句话说,我们将其与组织试图实现的kpi联系起来。


我个人认为ChatGPT非常有用,它使我能够使用利益相关者理解的语言与他们有效地沟通。例如,我在客户流失任务中使用了随机森林分类器,我使用了以下外行人的解释来向利益相关者展示模型,以便他们能够理解我的团队正在做什么:



我发现这非常有助于将我的信息传递给整个团队的不同利益相关者。没有专业术语,只是简单的英语。


另一个例子是,当我被要求一步一步地解释为一个产品特性进行AB Test的步骤时。下面是你可以用来解释的内容:


原文作者:Joe Tran

翻译作者:马薏菲

美工编辑:过儿

校对审稿:Chuang

原文链接:https://medium.com/@joetrankang/how-i-used-chatgpt-as-a-data-scientist-92edb579ca83

本周公开课预告


往期精彩回顾


MultiversX引领Web3革命,推出金融和社交功能齐备的超级应用!

Meta重组AI部门,将生成技术应用于产品中

AI关注度持续增长,加州正在加强监管力度!

高级SQL技巧与窍门:数据分析师必备!

科技巨头大规模裁员,但情况可能并没有你想的那么糟糕





点「在看」的人都变好看了哦

点击“阅读原文”查看数据应用学院核心课程

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存