Noteable:自动进行数据分析的ChatGPT插件
今日份知识你摄入了么?
在一个新插件的帮助下,ChatGPT将数据分析提升到了一个新的水平。不,我指的不是代码解释器,它还没有提供给所有ChatGPT Plus订阅者,而是一个名为Noteable的新插件。
图片由Shutterstock授权
Noteable是插件商店中提供的一个新的ChatGPT插件,它可以帮助我们在几秒钟内完成数据分析!你只需要使用我将在本文中向你展示的代码就可以开始使用这个插件。
以下是Noteable如何帮助你自动化数据分析的方法。
设置Noteable
首先,我们需要安装Noteable。要做到这一点,请前往插件商店并搜索Noteable。一旦你找到它,只需点击安装!
图片由作者提供
安装Noteable后,将弹出下面的窗口。你必须在开始使用这个插件之前创建一个帐户。
图片由作者提供
为什么我们需要一个账户?ChatGPT将显示我们要求的可视化和分析,但是所有的代码只能在Noteable中以笔记本格式提供。最重要的是,我们需要在Noteable上创建一个项目来使用插件。
登录后,你将看到如下所示的一个空格,其中包含一个名为“My First Project.”的默认项目。单击该项目或从头创建一个项目。
图片由作者提供
一旦你开始一个项目,复制链接。我们将在下一节中使用该链接。链接的格式应该如下所示。
https://app.noteable.io/p/<project_id>/<project_name>
使用Prompt
现在是时候让Noteable为我们做数据分析了!这是我们要使用的Prompt。
Load this dataset: <link of the dataset>
Use this as my default project: <link of the project>
Act as a data scientist and analyze ...
如你所见,我们只需要提供我们数据集和项目的链接。差不多就是这样了!
你可以让Noteable进行一般但快速的分析,也可以在Prompt中指定要获取的内容,让我们看看。
01
使用Noteable进行快速数据分析
首先,我们让Noteable自己进行数据分析,对一个包含1955年至2020年世界各国人口数据的数据集进行自动化数据分析。
加载此数据集:
https://github.com/ifrankandrade/python-course-for-excel-users/blob/main/4.Data%20Visualization/population_total.csv
作为一名数据科学家,分析数据集,制作图表,以显示世界各地人口增长的主要趋势。
以下是Noteable给出的数据集概述。
图片由作者提供
然后,它会自动关注2020年人口最多的5个国家,并绘制出1955年至2020年人口增长的线形图。
图片由作者提供
最后,它添加了一些注释来完成分析,不错!
02
定制数据分析与Noteable
现在,我们将告诉ChatGPT和Noteable我们想要进行的分析类型。对于这个例子,我们将使用一个数据集,其中包含有关FIFA20游戏中足球运动员的信息。我们将在下面的Prompt中指定要获得的可视化效果和要使用的列。
加载此数据集:
https://raw.githubusercontent.com/ifrankandrade/data-visualization/main/datasets/players_20.csv
作为一名数据科学家,分析来自美国、加拿大、英国、巴西和阿根廷的足球运动员。制作一个柱状图来分析“总体”这一栏,这一栏代表一个球员在足球方面的水平。制作直方图和箱线图来分析这些国家球员的平均身高。制作散点图,看看玩家的体重是如何分布的。最后,制作饼图以查看来自美国的前10名最有价值球员。
结果真是太棒了!ChatGPT和Noteable考虑了我提到的所有细节。
图片由作者提供
我自己做了这个数据分析(当时ChatGPT还不存在),并将其发表在一篇文章中(https://towardsdatascience.com/a-simple-guide-to-beautiful-visualizations-in-python-f564e6b9d392)。结果完全一样!
最后但同样重要的是,你可以访问通过Noteable网站生成的代码。
图片由作者提供
03
加载多个数据集并使用Noteable进行分析
我加载了多个数据集,并指导Noteable如何使用它们。结果和之前的测试一样好!
在下面的Prompt中,我加载了2017年、2018年、2019年、2020年和2021年《国际足联》游戏的5个数据集,以查看Messi和Cristiano Ronaldo等球员的FIFA评分(“总体”列)的演变。
加载这5个数据集:
https://raw.githubusercontent.com/ifrankandrade/data-visualization/main/datasets/players_17.csv
https://raw.githubusercontent.com/ifrankandrade/data-visualization/main/datasets/players_18.csv
https://raw.githubusercontent.com/ifrankandrade/data-visualization/main/datasets/players_19.csv
https://raw.githubusercontent.com/ifrankandrade/data-visualization/main/datasets/players_20.csv
https://raw.githubusercontent.com/ifrankandrade/data-visualization/main/datasets/players_21.csv
作为一名数据科学家,加载提供的5个数据集。每个数据集都代表了2017年、2018年、2019年、2020年和2021年FIFA比赛的评分。加载每个数据集后,用数据集的年份创建一个新列“years”。使用线图分析球员L.Messi、CristianoRonaldo、K.DeBruyne、V.vanDijk和K.Mbappé从2017年到2021年的“整体”演变。“整体”一栏代表一名球员的足球水平。
这是我得到的。
神奇吧!这就是我在这篇文章中发表的分析结果(https://towardsdatascience.com/a-simple-guide-to-beautiful-visualizations-in-python-f564e6b9d392)。
就是这样!现在轮到你使用Noteable自动进行数据分析了!
原文作者:The PyCoach
翻译作者:文杰
美工编辑:过儿
校对审稿:Chuang
原文链接:https://artificialcorner.com/noteable-the-chatgpt-plugin-that-automates-data-analysis-7f7ccd84f3c8
本周公开课预告
往期精彩回顾
我曾尝试84个ChatGPT插件,哪些值得推荐?
成为更好的数据分析师的5个习惯!
美国教育部分享对人工智能的见解和建议
优化SQL查询的10大技巧!
点击“阅读原文”查看数据应用学院核心课程