查看原文
其他

2021各省GDP新鲜出炉

爬虫俱乐部 Stata and Python数据分析 2022-12-31

本文作者:王玉洁,中南财经政法大学金融学院

本文编辑:谭   可

技术总编:戴   雯

Stata&Python云端课程来啦!

      为了平衡团队运营成本,维系公众号的运营,也与国内动辄数千元的Stata课程缩短差距,我们的网课不得不上调价格,我们决定于2022年4月1日起调价,Python课程的价格调整为399.9元Stata基础课程调为399.9元Stata进阶课程调整到399.9元。大家可以告知一下身边想要购买的小伙伴,欲购从速哦,对报名有任何疑问欢迎在公众号后台和腾讯课堂留言~我们在这篇推文提供了每门课程的课程二维码,大家有需要的话可以直接扫描二维码查看课程详情并进行购买哦~

引言

全国31个省市2021年的GDP数据新鲜出炉!从GDP总量来看,不少省份都 迈上了新台阶。值得注意的是,广东省的GDP突破12万亿,成为首个也是唯一一个GDP跨过12万亿的省份。

今年,广东还是稳坐GDP总量第一的宝座,江苏省GDP总量超过11万亿,依旧位居第二,这两个省份是目前“十万亿俱乐部“为数不多的会员。今年GDP增速最快的省份非湖北省莫属了,增速高达12.9%。仅仅只看这些数据根本无法给我们最直观的感受,因此,小编通过Stata绘制了以下图形,希望通过将数据可视化更清晰的展示2021年全国31个省份GDP的情况。

通过以上的条形图和折线图,我们可以更加清晰的看到不同省份GDP的发展情况。从排名来看,同去年相比,排名前十的省份名次基本没有变化。河南省的GDP总量虽然排在第五位,但是GDP增速很小。由于受疫情的影响,同去年相比,湖北省的GDP增速是最快的,其次是海南省,GDP增速远超其他省份。接下来,小编将带领大家一步步画出以上图形,实现数据可视化。
 绘制条形图 
首先,将Excel中GDP的数据导入到Stata中,并将第一行作为变量名,具体命令如下:
clear allcd D:\推文\各省GDPimport excel using GDP, first

在绘制条形图时要求所有的变量均为数值型,而我们导入的数据中,省份和GDP都是字符型变量,因此需要将它们转换为数值型变量。由于GDP是以字符型格式储存的数值变量,因此可以使用real()函数将其转化为数值型变量。sencode可以将字符型变量转为数值型变变量,同时可以通过gsort进行排序,因此这里使用sencode将省份转化为数值型变量并使用gsort对GDP进行排序。具体运行程序如下:

gen GDP1 = real(GDP)sencode 省份, gen(省份1) gsort (GDP1)drop 省份 GDPren 省份1 省份ren GDP1 GDP
处理后的数据如图所示:
                 
接着,利用twoway bar绘制条形图。在默认情况下,条形图是纵向的,要想绘制出横向的条形图,需要指定horizontal
twoway bar GDP 省份, horizontal barwidth(0.5) fcolor(orange%60) ylabel(1(1)31,valuelabel angle(0) labsize(*1.2)) ytitle("") xtitle("GDP") ysize(2) xsize(1) title(2021年各省GDP)
其中,barwidth和fcolor设置条形图中每个条形的宽度和颜色,这里宽度设为0.5,颜色为橙色。ylabel是用于指定y轴的标签选项,valuelabel表示使用变量的值标签来标记值,将31个省份全都显示出来。angle调整标签的角度,角度为0即水平显示标签,labsize调整标签文本的字体大小。title设置整个图形的标题,而ytitle和xtitle分别设置y轴和x轴的名称。最后,为了美化图形,将图形的长度ysize和宽度xsize之比设置为2:1。图形如下所示:

                          

 绘制折线图 

有了上面的基础,利用scatter命令绘制关于GDP增速的散点图,并将每个点都连接起来就更容易操作了。下面是具体的操作程序如下:

scatter 省份 GDP增速, c(l) mcolor(red) msize(1) ylabel(1(1)31,valuelabel angle(0) labsize(*1.2)) ytitle("") xtitle("实际增速") ysize(2) xsize(1) title(2021年各省GDP增速)

由于需要将相邻的点都连接起来,因此加上c(l),c就是connect,设定了散点图中点之间的连接方式。mcolor和msize都是设置点的选项,显然分别设定了点的颜色和大小。

最终生成的图形如下所示:

                           

 图形合并 
      为了同时展示出每个省份的GDP总值和增速,我们可以将条形图和折线图显示在同一张图表中。那么此时就需要利用twoway命令将两种类型的图绘制在一个画布中,代码如下:
twoway(bar GDP 省份,sort horizontal barwidth(0.5) fcolor(orange%60) ylabel(1(1)31,valuelabel angle(0) labsize(*1.2)) ytitle("") xtitle("GDP") ) ///(scatter 省份 GDP增速, c(l) mcolor(orange) msize(1) xaxis(2) xtitle("实际增速",axis(2))), ///legend(label(1 "GDP") label(2 "实际增速") region(lpattern(blank)) pos(2) ring(1) col(1) symy(2) symx(1) textw(10) keyg(1)) xline(20000 40000 60000 80000 100000, lstyle(p15)) ysize(2) xsize(1)

其中的legend选项用于设置图例的相关内容,这里的图例为GDP和实际增速。region选项中的lpattern将图例的轮廓设置为blank,即不显示边框。symy和symx分别设置key符号的高度和宽度,textw设置key文本的宽度,而keyg设置了符号和文本之间的距离间隔。

通过pos、ring和col选项对图例位置进行调整。position和ring通过设置中心点的方向和图例与绘图区域之间的距离,来确定图例在整个图形上的位置。col设置图例中GDP和实际增速两个键的之间的距离。

最终的图形如下图所示:

                           

从图中我们可以看出,河南省距离六万亿大关仅差一步之遥,浙江省与稳坐第三把交椅的人口大省山东的GDP差距较小,且增速较快,有望在将来成为经济总量第三的省份。从GDP增速来看,2021年我国GDP比去年增长8.1%,有许多省份跑赢了全国平均水平。湖北省和海南省的增速很是令人瞩目。

随着疫情的常态化,我国经济发展依然有较大韧劲,经济增加质量正在提升,社会环境在不断改善。我们要坚信2022年全国经济发展一定有会有更大的成果!

END
最后,我们为大家揭秘雪球网(https://xueqiu.com/)最新所展示的沪深证券和港股关注人数增长Top10。



腾讯课堂课程二维码





            


 对我们的推文累计打赏超过1000元,我们即可给您开具发票,发票类别为“咨询费”。用心做事,不负您的支持!














往期推文推荐

 爬虫实战-采集全国各省疫情数据

log——为你的操作保驾护航

 一行代码教你玩转emoji

 票房遇冷的春节档口碑冠军丨《狙击手》影评分析

 学习丰县,营造良好营商环境!

 大国丢娃图:从川渝到徐州!

 丰县“失火”,殃及徐州:股市超跌近30亿!

 Unicode转义字符——编码与解码

        徐州!徐州!

        B站弹幕爬虫——冬奥顶流冰墩墩&雪容融

        不会用Stata做描述性统计表?so easy!

        丰沛之地:备足姨妈巾

 过年啦,用Python绘制一幅属于你的春联吧!

       登上爬虫俱乐部“时光机” |上“机”出发 开启一段奇妙之旅

       【基础篇】查找并输出子字符串的定位

        Stata中的小清新命令——添加观测值

        PCA(主成分分析法)降维——Python实现

       超好用的事件研究法

        如何绘制任泽平《鼓励生育基金》的几幅图

        Python 第六天——字符串

        findname——想要什么找什么

        Python字符串之“分分合合”

        PDF转docx可批量操作?——wordconvert的小技巧

        考研之后,文科生需以“do”躬“do”!

       手绘五星兴家国——用Stata绘制五星红旗

        Seminar丨董事会的性别多样化和企业创新:来自国际的证据

       Python与数据库交互——窗口函数

        Stata之post命令——数据邮递 

        爬虫俱乐部成员的Stata学习经验分享来啦!

       Seminar丨2002年萨班斯·奥克斯利法案的经济后果

        我几乎画出了“隔壁三哥”家的国旗

        Python基础——三大数字类型,你都了解吗?
        如何用Stata绘制带指向性箭头标注的图像       
       Seminar丨荐仆贷款——19世纪中国的信任辅助贷款       【技能篇】多进程队列间通信

关于我们 


   微信公众号“Stata and Python数据分析”分享实用的Stata、Python等软件的数据处理知识,欢迎转载、打赏。我们是由李春涛教授领导下的研究生及本科生组成的大数据处理和分析团队。

   武汉字符串数据科技有限公司一直为广大用户提供数据采集和分析的服务工作,如果您有这方面的需求,请发邮件到statatraining@163.com,或者直接联系我们的数据中台总工程司海涛先生,电话:18203668525,wechat: super4ht。海涛先生曾长期在香港大学从事研究工作,现为知名985大学的博士生,爬虫俱乐部网络爬虫技术和正则表达式的课程负责人。



此外,欢迎大家踊跃投稿,介绍一些关于Stata和Python的数据处理和分析技巧。

投稿邮箱:statatraining@163.com投稿要求:
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里
为作者署名,并有赏金分成。

2)邮件请注明投稿,邮件名称为“投稿+推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到有关数据处理、分析等问题,可以在公众
号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存