福利分享:一篇实证文章中常用的命令代码
今日小记
一篇实证文章的完成,并非一日之功!就比如,经济管理专业的实证类学术论文的撰写,不仅需要长时间的文献理论知识的积累,还需要掌握数据统计分析的能力,尤其是在当前大数据、复杂算法风靡的背景下。
实际上,统计分析方法与相关理论知识是相辅相成的。统计分析方法是运用更加科学、更加灵活的数据统计分析来辅助我们观察经济发展、管理实践中的各种现象,且随着经济社会的快速发展,一些理论基础知识已经无法有效地指导现实问题。此时,大数据的优势及其多种先进的数据分析方法有助于推进传统理论知识的进步和新理论的萌生,掌握数据分析方法尤为必要。
为此,在完成一篇经济管理学的学术论文,除了不可回避的付出和努力外,我们不仅需要掌握扎实的理论基础,而且还需要熟练基本的统计分析方法,以辅助自己的科研工作。为响应部分读者的要求,今天我将自己多年总结和积累的常用命令代码分享给大家,希望能对你们的科研工作有所帮助。
在这里,分享一个心得:建议读者们在学习计量方法时,应该“边学边做”,不要单独学习“计量方法”,否则你很快会忘记所学的计量方法(这主要针对大部分文科出身、刚起步学习计量的伙伴,搞数学、数量经济研究的除外),且可将所积累的命令代码,积累在一个Word文档中,方便每次文章写作时直接采用!
当然,我也在学习中,积累中,探索中!向前进!
文/杯中鸟911
简单计算类命令分享
1.在面板数据中后一年减去前一年的值(增加值求法)命令
gen dx=x-x[_n-1]
2.在面板数据中变量前一期(n-1期)命令
Tsset name year ,即格式:tsset (公司或代码)(年份)
gen Lag(var)=l.var
3.增长率计算命令
Tsset name year,即格式:tsset (公司代码)(年份)
gen pergdp=gdp/gdp[_n-1]-1
4.如何将一连续变量生存其哑变量的命令,例:
gen dmarket=1 if market>=8.94(其中, 8.94为中位数或均值)
replace dmarket=0 if market<8.94
5. 变量缩尾处理
ssc install winsor, replace
winsor X,gen(X_w2) p(0.01)
6. 中位数求法:
tabstat variable, stats (sd median range)
7. 将文本型改为数值型
egen newname=group( name )
8. 将红色字体转化为黑色字体
destring name, replace force
9. 在stata中回归时如何一次性控制年度哑变量
reg y x1 x2 x3 x4 i.industry
10. 中介效应命令
sgmediation 因变量, mv(中介变量) iv(自变量) cv(控制变量)
11.不同样本中某变量的中位数和均值比较
均值: ttest var1,by(group)
单变量均值比较:ttable2 xinzenginvest_w2 b24b2 zhengceyoushui jisuchuangxin, by(zhengceyoushui)
中位数: median var1,by(group)
12. 生成哑变量:如行业哑变量
tab X, gen(dummy_hangye)
复杂分析类命令分析
1.如何同时导出多个回归分析的结果
跑多个其实也不难,只要每跑完一个regression,你把它取个名字存起来:est store m1。m1是你要改的,第一个model所以我叫m1,第二个的话指令就变成est store m2,依次类推。运行指令:esttab m1 m2 ... using test.rtf就行了。
如果你跑了一系列的regression之后,要跑下一系列,记得打est clear,将你之前存的先清掉。所以指令像是这样:
est clear
regression .....
est store m1
regression ...
est store m2
esttab * using test.rtf,star(* 0.1 ** 0.05 *** 0.01)
esttab m1 m2 m3 using test1.rtf,r2 ar2 replace nogap star(* 0.1 ** 0.05 *** 0.01) b(%6.3f) t(%6.3f)
2. 如何计算除逆米尔斯比率imr
首先,通过运用probit模型计算影响所考察变量的哑变量(0-1)的影响因素,
其次,进一步计算:predict w,xb
再次,计算:gen imr=normalden(w)/normal(w)
最后,将所生成的逆米尔斯比率imr引入主要考察模型,并予以控制。
3. 逻辑函数的介绍
stata 中一共有6中关系运算符:== 等于、!=不等于、> 大于、< 小于、>=大于等于、<= 小于等于;
逻辑运算符有3种:& 和、| 或、!或者~,表示否
选项in用于指定命令所应用的观测的案例编号
4. 导出相关性分析结果
例:logout, save(文件名) word replace: pwcorr cost revenue down overpay state1 lev size gdp renliziben aintensity idp daul dummyshare bsize,sig star(.05)
或asdoc corr (后面跟着变量)price mpg weight length
5. 回归异方差处理方法
直接用命令reg y x1 x2 xk[aw=1/eles] 就可以了。具体的步骤是:
(1)先做OLS,导出残差e;
(2)生成残差的平方得到es;
(3)将残差的平方取对数得到les;
(4)将les对x1 x2 xk做OLS回归,得到les的拟合值;
(5)对拟合值取指数得到eles。
最后,输入上面的命令就可以了,不需要对每个解释变量进行处理。
6. Stata14中文乱码问题的解决
clear
unicode analyze 2016-data.dta
unicode encoding set gbk
unicode translate 2016-data.dta ,invalid(mark)
use 2016-data.dta,clear
END
本文作者:杯中鸟911,现北京“C9”高校工作。
微信公众号:社经研究社(SES-2019),专注社会与经济交叉学科的研究/个人学术心得分享/论文写作讨论。
在后续更新中,只推送有价值的干货信息。