其他
统计年鉴数据整理小技巧
本文作者:王 悦,中南财经政法大学金融学院
本文编辑:赵冰洁
技术总编:余术玲
爬虫俱乐部云端课程
import excel using sample.xls,clear
import excel using sample.xls,clear
keep A-D
rename * (prov GDP pGDP POP)
destring _all, replace ignore("--")
gen year = 2019
order prov year
save 2019, replace
...
}
rename * v#, addnum //内存中所有的变量A-AE变为v1-v31
local j = 2019
,随着循环依次生成年份,完整程序如下:import excel using sample.xls, clear
drop in 1/2
ren * v#, addnum
des //得到总变量数(可通过return list查看返回值r(k)),以便在循环中调用
local j = 2019
forv i = 2(3)`r(k)' {
preserve
keep v1 v`i'-v`=`i'+2' //保留当年变量,每3个为一组
rename * (prov GDP pGDP POP)
gen year = `j' //生成对应年份
save `j', replace
local j = `j' - 1
restore
}*合并dta文件
clear
fs *.dta
foreach c in `r(files)' {
append using `c'
}
destring _all, replace ignore("--")
order prov year
sort prov year
save sample, replace
reshape
命令进行“宽to长”的转换,但是内存中的变量的名称并不允许我们这么做,如果我们可以将变量名变为如下形式:reshape long GDP pGDP POP, i(prov) j(year)
达到我们的目的。问题是如何实现上述的重命名呢?笔者采用的是如下一个简单的循环:import excel using sample.xls,clear
des
ren * v#, addnum
local j = 1
forv i = 2(3)`r(k)' {
ren v`i' GDP`=2020-`j''
ren v`=`i'+1' pGDP`=2020-`j''
ren v`=`i'+2' POP`=2020-`j''
local j=`j'+1
}
drop in 1/2
ren v1 prov
reshape
命令进行“宽to长”的转换即可:destring _all, replace ignore("--")
save sample, replace
Seminar | 作为飞行员,我比别的CEO多了什么?
利用TensorFlow构建前馈神经网络
推文合集(1)| Stata学习者必看的n篇推文!
Seminar | 诚信的价值
利用tushare获取股票数据及实现可视化
从Excel到Stata的“摆渡车”——import excel命令
光阴十载,见证了《经济研究》中的“高被引”
利用tushare获取股票数据
这些年,经管类C刊都在研究什么?
Seminar | 眼见为实吗?高管面部可信度、审计师任期与审计费用
Seminar | 恐怖袭击与CEO薪酬
代码补全,主题更换,Jupyter Notebook原来可以这样用?
【爬虫实战】“双十一”微博热搜实时跟进
Stata中的数值型变量分类神器--recode
fs命令——我们的小帮手【邀请函】听说你还在为处理表格头大?
用stack取代excel的数据重整操作吧Seminar | 委托贷款:打开中国影子银行的黑匣子
Seminar | 电话会议中的"non-answer"
微信公众号“Stata and Python数据分析”分享实用的stata、python等软件的数据处理知识,欢迎转载、打赏。我们是由李春涛教授领导下的研究生及本科生组成的大数据处理和分析团队。
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。
2)邮件请注明投稿,邮件名称为“投稿+推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到有关数据处理、分析等问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。