查看原文
其他

数据呈现 | 气泡图:绘制带权重的散点图

简华 数据Seminar 2021-06-04




引言

气泡图(bubble chart)可用于展示三个变量之间的关系。它与散点图类似,绘制时将一个变量放在横轴,另一个变量放在纵轴,不同之处在于:气泡图允许在图表中额外增加第三个含权重的变量,其气泡的大小指示相对重要程度。

气泡图绘制应要表达三个变量间的相互关系,而不能机械的组合在一起。比如,我们研究人均GDP与预期寿命的关系,可以选择人口数量作为权重绘制气泡图;又如,当研究销售数量和销售额的关系,我们可以用毛利率作为权重绘制气泡图。
如果我们要研究人才增长、创新创业和GDP之间的关系,如何用气泡图进行绘制呢?
下表1是创新创业数据集,其中prov是省份名称,index是创新创业指数,lnRD是研发人员全时当量对数。

表1 创新创业数据集

注:数据来源于企研数据和中国统计年鉴,经企研数据整理并提供



用Stata和R绘制气泡图


Stata气泡图绘制——Scatter

stata绘制气泡图,我们主要用到散点图命令:

导入创新创业数据集:

import excel "C:\Users\创新创业指数.xlsx", sheet("Sheet1") firstrow
左右滑动查看更多

绘制气泡图,第一个scatter是绘制带有拟合曲线的气泡图,第二个scatter是打标签:

twoway(scatter index lnRD [fweight=GDP],msymbol(Oh))(qfit index lnRD) ///(scatter index lnRD,xtitle("R&D人员全时当量(人年)对数") ytitle("创新创业指数") mlabel(prov) ms(i)
左右滑动查看更多
保存图形:
graph save Graph "C:\Users\Bubble.gph"

左右滑动查看更多

Stata气泡图展示:

注:图形经过调像处理

R气泡图绘制——geom_point

R绘制气泡图,我们主要用到ggplot2包中的geom_point命令:
## 加载包library(openxlsx)library(ggplot2)
## 读取创新创业数据集sampledata_set<-read.xlsx('C:/Users/创新创业指数.xlsx',1)
## 绘制气泡图ggplot(sampledata_set,aes(x=lnRD,y=index,size=GDP))+geom_point(shape=1)+geom_smooth(method = "lm", formula=y~poly(x,2),se=F, linetype="dashed")+scale_size(range = c(1.4, 19))+geom_text(aes(x=lnRD+0.4,label=prov),size=4)+theme_bw()+theme(legend.position = "none")+labs(x='R&D人员全时当量(人年)对数',y='创新创业指数')

左右滑动查看更多

R绘制气泡图展示:




小结

对比两幅图形,Stata和R软件的两种制图所达到的预期效果和结论一致。相对来说,stata绘制的气泡图使用的命令并不复杂,但对图形进行细节装饰不太灵活。R绘制的气泡图所使用的参数设置比较多,制作灵活,但也需要不断调试才能达到美观效果。
从效果上说,利用上图我们似乎可以更好地展示如下逻辑:如果说创新、创业是当前各地推动经济增长的“好抓手”,那么人才的支撑是必不可少的。

_______________________________

注:阅读原文,下载创新创业数据集。











►一周热文

数据呈现丨R画树状图:一种轻量级方法

因果推断丨中国学者用双重差分做了哪些工作?

数据呈现丨R语言相关关系可视化函数梳理

数据呈现丨R语言可视化学习笔记之gganimate包

统计计量丨工具变量法(四):GMM

软件应用丨经济学专业学习Python之数据存储篇

软件应用丨38个常用Python库:数值计算、可视化、机器学习等8大领域都有了






数据Seminar

这里是大数据、分析技术与学术研究的三叉路口



作者:简华(何年华)审阅:杨奇明编辑:青酱







    欢迎扫描👇二维码添加关注    


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存