其他
数据治理 | 随心所欲的Pandas绘图!
本文目录
一、前言
二、Pandas 绘图说明
绘制柱状图 绘制折线图 三、总结
📜本文共4645字,预计阅读时间12分钟,感谢阅读!
💡本文所用数据为:
数字经济专题数据库1978-2019年时间分布统计数据
数字经济专题数据库存活企业省级区域分布统计数据(截止2019年06月)
💡数据获取方式:关注本公众号,后台回复关键词“202204”即可获取
Part1前言
Part2Pandas 绘图说明
plot()
方法来做数据可视化的,这是因为 plot() 方法是对 matplotlib
模块一部分功能的封装。而 matplotlib 是 Python 中最重要的数据可视化模块之一,Pandas 通过这种方式来“借用”其他模块的功能,实现简单快速的数据可视化操作。matplotlib
模块。win+R
,输入 cmd
后回车,打开命令提示符界面并输入以下命令:pip install matplotlib
# 导入 matplotlib 模块
import matplotlib.pyplot as plt
# 设置中文字体为黑体
plt.rcParams['font.sans-serif'] = ['SimHei']
# 设置使负号 '-' 正常显示
plt.rcParams['axes.unicode_minus'] = False
1绘制柱状图
import pandas as pd
path = '数字经济专题数据库存活企业省级区域分布统计数据(截止2019年06月).xlsx'
# 注意读取数据时,不要将数字字段读取为字符型
data = pd.read_excel(path)
data.head() # 输出查看数据前 5 行
df.plot.bar()
。使用以上数据绘制柱状图的代码如下:"""
参数说明:
x : 所绘图形横轴变量,如果使用 DataFrame 绘图,
传入字段名即可。默认值是数据索引
y : 所绘图形纵轴变量,也就是数据值。
color : 柱状图“柱子”的颜色,传入多个颜色时,
需要使用列表或字典,默认值为蓝色
subplots :是否显示子图,仅当存在多类“柱子”时才有意义,
默认值为 False,表示不显示子图
"""
# 绘图代码
data.plot.bar(x='省份名称', y='企业存量')
# 以下两个操作全局生效,后续绘制的图形也受影响
# 调整生成的图像的尺寸和比例(宽高比例)
plt.rcParams['figure.figsize'] = (10, 5)
# 设置图像清晰度,表示每英寸像素点数
plt.rcParams['figure.dpi'] = 500
# 绘图代码
data.plot.bar(x='省份名称', y='企业存量')
# 设置混合颜色制作一张柱状图
data.plot.bar(x='省份名称',
y='企业存量',
color=['skyblue','yellow','pink','green'])
2绘制折线图
path_1 = '数字经济专题数据库1978-2019年时间分布统计数据.xlsx'
data_1 = pd.read_excel(path_1, nrows=42)
data_1.head()
df.plot.line()
。下面我们使用上面的数据来绘制一张描述企业数量随年份变化的折线图。"""
参数说明:
x : 所绘图形横轴变量,如果使用 DataFrame 绘图,
传入字段名即可。默认值是数据索引
y : 所绘图形纵轴变量,也就是数据值。
color : 折线图“折线”的颜色,传入多个颜色时,
需要使用列表或字典,默认值为蓝色
subplots :是否显示子图,仅当存在多条折线时才有意义,
默认值为 False,表示不显示子图
"""
# 绘制折线图
# 这里仅指定了横轴的自变量,那么纵轴的因变量将会是除自变量外所有字段
# 对应到数据中就是 成立企业数、死亡企业数、企业存量
data_1.plot.line(x = '年份')
data_1.plot.line(x = '年份', subplots=True)
# 颜色参数格式为字典,与折线一一对应
data_1.plot.line(x = '年份',
color={'成立企业数':'green', '死亡企业数':'gray', '企业存量':'red'})
plt.rcParams['font.size'] = 15 # 设置字体大小
plt.rcParams['lines.linewidth'] = 3 # 设置线宽
plt.rcParams['lines.linestyle'] = '-.' # 设置线条样式
plt.rcParams['savefig.jpeg_quality'] = 95 # 设置图片质量
plt.rcParams['text.color'] = 'purple' # 设置文本颜色
# 新增这些属性后,再绘制一张折线图
data_1.plot.line(x = '年份',
color={'成立企业数':'green', '死亡企业数':'gray', '企业存量':'red'})
Part3总结
💡本文所用数据为:
数字经济专题数据库1978-2019年时间分布统计数据
数字经济专题数据库存活企业省级区域分布统计数据(截止2019年06月)
💡数据获取方式:关注本公众号,后台回复关键词“202204”即可获取
我们将在数据治理板块中推出一系列原创推文,帮助读者搭建一个完整的社科研究数据治理软硬件体系。该板块将涉及以下几个模块(点击标题即可跳转至相应合集):
星标⭐我们不迷路!想要文章及时到,文末“在看”少不了!
点击搜索你感兴趣的内容吧
往期推荐
数据Seminar
这里是大数据、分析技术与学术研究的三叉路口
文 | 《社科领域大数据治理实务手册》
欢迎扫描👇二维码添加关注