将ChatGPT用于数据科学
今日份知识你摄入了么?
图片来自Shutterstock,作者Frank Andrade
ChatGPT可以做很多很酷的事情,其中一个是写代码。
你只需要给出正确的指令,ChatGPT就会为你做这项工作。它可以帮助你使用自然语言创建SQL查询,解决你的编码问题,将你的Python代码转换为R, Java, Julia等!
下面介绍如何在编程和数据科学中使用ChatGPT。
第一件事:创建一个账户
如果你是ChatGPT的新手,你必须使用此链接(https://chat.openai.com/auth/login)创建一个新帐户。
你必须提供你的电子邮件地址和电话号码才能开始使用ChatGPT。
一旦你成功注册,将会看到下图。在底部的方框中,你可以写下任何你想要的命令。
让我们看看可以用ChatGPT做什么。
1
向ChatGPT提出编码问题
如果你有一个编码问题,你会去StackOverflow,希望投票最多的答案之一能解决你的问题。
好,现在你可以向ChatGPT提出同样的问题了。比如说,我们忘记了如何在Python中合并字典,所以我们问如何在Python中合并字典?
除了给出正确答案外,ChatGPT还提供了第一个答案的替代方案。
但这还不是全部!你可以询问与pandas、numpy、matplotlib和其他数据科学库相关的问题。
2
将Python代码翻译为R语言
假设你是一个懂Python的数据科学家,不熟悉R。如果你想把你的Python代码翻译成R,你可以问ChatGPT将下面的函数从Python翻译成R:
def get_square(num):
return num * num
ChatGPT不仅完成了这项工作,而且还很好地解释了该函数以及如何在R中使用它。
对于那些几乎不知道如何打印“Hello World in R”的人来说非常有用。
但还有更多!如果你在Python中使用数据框架,由于某种原因,你需要在R中复制你的工作,该怎么办?ChatGPT可以帮你一把。
将另一个函数从Python翻译到R:
def get_stats(event_name):
df_stats = df[df['event_name']==event_name]
stats = df_stats['player_id']
stats = stats.value_counts()
return stats
看到结果后,现在你知道你可以在R中选择带$符号的列,并且pandas的.value_counts相当于R中的table函数。
我甚至在R中测试了代码,运行得很好!
3
自然语言到SQL查询
Open AI声称你可以用自然语言编写SQL查询。让我们来测试一下。
让我们从一个简单的查询开始。
创建一个SQL查询,查找居住在纽约且年龄大于30岁的用户。
现在让我们看看如果我们加入更多细节会发生什么。
列出在过去3个月雇用超过10名员工的部门名称的查询。考虑以下SQL表及其属性:
#员工(id,姓名,部门id)
#部门(id,名称,地址)
#工资支付(id,员工id,金额,日期)
4
文本分类
我们还可以使用ChatGPT将文本分类为正/负。
对这些推文中的情绪进行分类:
“我爱我的工作”
“摇滚聊天机器人!”
“我的狗很可爱”
“我讨厌巧克力”
5
数据可视化
我们可以用ChatGPT进行可视化。我们只需要指定要使用的编程语言和库。
用Python使用matplotlib绘制线性回归图
我复制/粘贴了代码,得到了下面的图形。
很酷,不是吗?你可以用这个聊天机器人做几百件事。
在这里(https://beta.openai.com/examples),你可以探索使用ChatGPT可以能做的更多事情。测试一下,让我知道你的想法!
原文作者:Frank Andrade
翻译作者:马薏菲
美工编辑:过儿
校对审稿:Chuang
原文链接:https://medium.com/geekculture/using-chatgpt-for-data-science-ac5f8a00fb5a
本周公开课预告
往期精彩回顾
数据应用学院圣诞节福利来啦!数据科学读书会课程任选一个免费送!
点击“阅读原文”查看数据应用学院核心课程