让AI帮你数据分析 | PandasAI
学废过Python(本人很有感触…),做过数据分析的小伙伴,对于Pandas应该有所耳闻。Pandas是使用Python分析数据时非常方便的数据分析库,但它有个问题,就是上手有些门槛,对于没有代码基础的小伙伴不太友好。今天介绍一个将Pandas和AI结合,让ChatGPT帮你使用Pandas分析数据的工具——PandasAI,能够极大地帮你提升分析数据的效率,降低数据分析的门槛。
安装Pandas
本来安装Pandas有些麻烦,但是安装一个我们之前介绍过的Anaconda(一个傻瓜式整合Python的软件),安装好了就自带Pandas库了,点击查看安装流程。
安装PandasAI
打开安装好的Anaconda软件,然后点击打开Jupyter Notebook。
点击“new”,新建一个Python 3文件:
在打开文件里,输入以下代码,以安装PandasAI:
pip install pandasai
等待片刻,重启一下刚才新建的文件即可安装完毕。
试试效果
首先将需要的分析库导入,输入以下代码:
import pandas as pd
from pandasai import PandasAI
from pandasai.llm.openai import OpenAI
分析需要用到Open AI的api key,输入以下代码以调用ChatGPT的接口:
OPENAI_API_KEY = "YOUR_OPENAI_API_KEY"
llm = OpenAI(api_token="YOUR_OPENAI_API_KEY")
至此,准备工作完毕,我们调用官方的案例来试试分析效果,输入以下代码以建立案例数据表:
df = pd.DataFrame({
"country": ["United States", "United Kingdom", "France", "Germany", "Italy", "Spain", "Canada", "Australia", "Japan", "China"],
"gdp": [21400000, 2940000, 2830000, 3870000, 2160000, 1350000, 1780000, 1320000, 516000, 14000000],
"happiness_index": [7.3, 7.2, 6.5, 7.0, 6.0, 6.3, 7.3, 7.3, 5.9, 5.0]
})
df.head()
可以看到数据表效果:
我们来尝试问下上述国家中,最幸福的5个国家有哪些?
pandas_ai = PandasAI(llm)
pandas_ai.run(df, prompt='最幸福的5个国家有哪些?')
返回的结果是:
According to the data, the top 5 happiest countries are the United States, Canada, Australia, the United Kingdom, and Germany.
还可以让ChatGPT帮你调用Pandas画图,输入以下代码:
pandas_ai.run(
df,
"Plot the histogram of countries showing for each the gpd, using different colors for each bar",
)
意思是画出每个国家的GDP条形图,每个组颜色不一样,得到的效果如下:
我滴个乖乖,效果很赞,数据分析师也可能要失业了……
赶快跟我一起疯狂学习AI吧!
以上就是今天的所有内容了,你有没有学废呢?有问题可以随时问我,知无不言~
PandasAI开源链接:
https://github.com/gventuri/pandas-ai
往期回顾
AI绘画相关:
补全AI绘画最后一块拼图 | 用ControlNet精准绘图
ChatGPT相关:
推荐一款工作提效小程序:
关注我,跟我一起疯狂学习AI,请在右下角点一下“在看”~