用Stata做面板数据分析,程序代码应知应会
计量经济学服务中心专辑汇总!计量百科·资源·干货: Stata |Python |Matlab |Eviews |R Geoda |ArcGis |GeodaSpace |SPSS 一文读懂 |数据资源 |回归方法 |网络爬虫 门限回归 |工具变量 |内生性 |空间计量 因果推断 |合成控制法 |倾向匹配得分 |断点回归 |双重差分 面板数据 | 动态面板数据
*===============================================================================
* 面板数据计量分析
*===============================================================================
*1、导入数据
use "E:\stata\data\FDI.dta", clear
*2、面板数据设定与描述性统计
xtset state year
xtdes
xtsum lngdp lnfdi lnie lnex lnim lnci lngp
xtline lngdp
*3、面板数据计量分析
*3.1 POOL混合回归
reg lngdp lnfdi lnie lnex lnim lnci lngp, vce(cluster var1)
*3.2 组内估计量
xtreg lngdp lnfdi lnie lnex lnim lnci lngp, fe r
*3.3 LSDV
reg lngdp lnfdi lnie lnex lnim lnci lngp i.var1, vce(cluster var1)
*3.4 组间估计量
xtreg lngdp lnfdi lnie lnex lnim lnci lngp i.year, be
*3.5 固定效应分析
*1、个体固定效应模型代码为:
*#方法1
xtreg lngdp lnfdi lnie lnex lnim lnci lngp,fe r
*#方法2
reg lngdp lnfdi lnie lnex lnim lnci lngp i.id, r
*2、时间固定效应模型代码为:
*【时点】固定效应变截距模型
reg lngdp lnfdi lnie lnex lnim lnci lngp i.year, r
*3、个体时间双固定效应模型代码为:
*#方法1
xtreg lngdp lnfdi lnie lnex lnim lnci lngp i.year,fe r
*#方法2
reg lngdp lnfdi lnie lnex lnim lnci lngp i.state i.year, r
*4、固定效应面板数据分析
tab year,gen(year) //生成时间虚拟变量
xtreg lngdp lnfdi lnie lnex lnim lnci lngp year2-year7, fe r //双向固定效应
xtreg lngdp lnfdi lnie lnex lnim lnci lngp i.year, fe r //双向固定效应
*4、面板数据随机效应估计
xtreg lngdp lnfdi lnie lnex lnim lnci lngp, re
xtreg lngdp lnfdi lnie lnex lnim lnci lngp, re r //随机效应FGLS
*5、面板数据模型选择
*5.1、检验时间效应(混合效应还是随机效应)
*(检验方法:LM统计量) (原假设:使用OLS混合模型)
qui xtreg lngdp lnfdi lnie lnex lnim lnci lngp,re
xttest0
*5.2 固定与随机效应模型检验
xtreg lngdp lnfdi lnie lnex lnim lnci lngp,re
est store re
xtreg lngdp lnfdi lnie lnex lnim lnci lngp,fe
est store fe
hausman fe re
*(或者更优的是hausman fe,sigmamore/ sigmaless)
*===============================================================================
* 面板数据计量分析
*==================================================================
一.静态面板数据操作
(一)数据处理
输入数据
use "E:\stata\data\FDI.dta", clear
tsset code year 该命令是将数据定义为“面板”形式
xtset code year
xtdes 该命令是了解面板数据结构
summarize lngdp lnfdi lnie lnex lnim lnci lngp
各变量的描述性统计(统计分析)
拓展命令:
gen lag_y=L.y 产生一个滞后一期的新变量
gen F_y=F.y 产生一个超前项的新变量
gen D_y=D.y 产生一个一阶差分的新变量
gen D2_y=D2.y 产生一个二阶差分的新变量
二.静态(短)面板数据固定效应汇总
固定效应篇
主要包括混合效应VS固定效应,LSDV方法、双向固定效应等
1、检验个体效应(混合效应还是固定效应)(原假设:使用OLS混合模型)
xtreg lngdp lnfdi lnie lnex lnim lnci lngp,fe
其中选项fe表明我们采用的是固定效应模型,表头部分的前两行呈现了模型的估计方法、界面变量的名称(id)、以及估计中使用的样本数目和个体的数目。第3行到第5行列示了模型的拟合优度、分为组内、组间和样本总体三个层面,通常情况下,关注的是组内(within),第6行和第7行分别列示了针对模型中所有非常数变量执行联合检验得到的F统计量和相应的P值,可以看出,参数整体上相当显著。需要注意的是,表中最后一行列示了检验固定效应是否显著的F统计量和相应的P值。显然,本例中固定效应非常显著。
对于固定效应模型而言,回归结果中最后一行汇报的F统计量便在于检验所有的个体效应整体上显著。在我们这个例子中发现F统计量的概率为0.0000,检验结果表明固定效应模型优于混合OLS模型。
xtreg lngdp lnfdi lnie lnex lnim lnci lngp,fe r
xtreg lngdp lnfdi lnie lnex lnim lnci lngp,fe r
等价于
xtreg lngdp lnfdi lnie lnex lnim lnci lngp,fe vce(cluster id)
2、固定效应LSDV法
reg lngdp lnfdi lnie lnex lnim lnci lngp i.id,fe vce(cluster id)
3、双向固定效应
xtreg lngdp lnfdi lnie lnex lnim lnci lngp i.year,fe r
结果强烈拒绝无时间效应的原假设,认为模型存在时间效应
结果强烈拒绝无时间效应的原假设,认为模型存在时间效应
三.个体固定效应、时间固定、双固定效应模型操作
1、个体固定效应模型代码为:
#方法1
xtreg lngdp lnfdi lnie lnex lnim lnci lngp,fe r
#方法2
reg lngdp lnfdi lnie lnex lnim lnci lngp i.id, r
结果为:
2、时间固定效应模型代码为:
【时点】固定效应变截距模型
reg lngdp lnfdi lnie lnex lnim lnci lngp i.year, r
3、个体时间双固定效应模型代码为:
#方法1
xtreg lngdp lnfdi lnie lnex lnim lnci lngp i.year,fe r
#方法2
reg lngdp lnfdi lnie lnex lnim lnci lngp i.state i.year, r
reg lngdp lnfdi lnie lnex lnim lnci lngp i.var1 i.year, r
Linear regression Number of obs = 341
F(46, 294) = 4217.98
Prob > F = 0.0000
R-squared = 0.9975
Root MSE = .05897
------------------------------------------------------------------------------
| Robust
lngdp | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
lnfdi | .0152438 .0170456 0.89 0.372 -.0183031 .0487907
lnie | -.0592966 .0448992 -1.32 0.188 -.1476612 .0290679
lnex | .1103377 .0285485 3.86 0.000 .0541523 .166523
lnim | .0481628 .0214432 2.25 0.025 .0059611 .0903644
lnci | .150422 .0327891 4.59 0.000 .0858909 .2149531
lngp | -.1767717 .061193 -2.89 0.004 -.2972037 -.0563398
|
var1 |
120000 | -.5145403 .0440615 -11.68 0.000 -.6012563 -.4278244
130000 | .3769029 .056382 6.68 0.000 .2659394 .4878663
140000 | -.2560204 .0622532 -4.11 0.000 -.3785387 -.133502
150000 | -.0588581 .0746528 -0.79 0.431 -.2057797 .0880635
210000 | .1970042 .0357982 5.50 0.000 .126551 .2674574
220000 | -.3204478 .0543751 -5.89 0.000 -.4274615 -.213434
230000 | -.1365009 .0672592 -2.03 0.043 -.2688714 -.0041304
310000 | .0712601 .0439292 1.62 0.106 -.0151955 .1577157
320000 | .7902045 .0504775 15.65 0.000 .6908614 .8895475
330000 | .4645629 .0522032 8.90 0.000 .3618235 .5673024
340000 | .0077339 .0557546 0.14 0.890 -.1019949 .1174626
350000 | -.0944303 .04837 -1.95 0.052 -.1896255 .000765
360000 | -.234365 .0589496 -3.98 0.000 -.3503817 -.1183484
370000 | .8209852 .0519667 15.80 0.000 .7187113 .9232591
410000 | .5211137 .0640315 8.14 0.000 .3950955 .6471318
420000 | .2072618 .0553218 3.75 0.000 .098385 .3161387
430000 | .273798 .0623413 4.39 0.000 .1511061 .3964898
440000 | .8896234 .052403 16.98 0.000 .7864909 .9927559
450000 | -.2604254 .058295 -4.47 0.000 -.3751539 -.145697
460000 | -1.583126 .0664447 -23.83 0.000 -1.713893 -1.452358
500000 | -.404726 .0591066 -6.85 0.000 -.5210516 -.2884004
510000 | .321555 .0509501 6.31 0.000 .2212818 .4218282
520000 | -.6264375 .1073602 -5.83 0.000 -.8377295 -.4151455
530000 | -.3795609 .0718553 -5.28 0.000 -.5209767 -.238145
540000 | -2.500765 .1749716 -14.29 0.000 -2.845121 -2.15641
610000 | -.1502207 .0665677 -2.26 0.025 -.2812302 -.0192112
620000 | -.8002214 .089508 -8.94 0.000 -.976379 -.6240637
630000 | -1.771786 .1309078 -13.53 0.000 -2.029421 -1.514151
640000 | -1.759492 .1162146 -15.14 0.000 -1.988209 -1.530774
650000 | -.6987931 .0880211 -7.94 0.000 -.8720245 -.5255617
|
year |
2006 | .1302531 .022499 5.79 0.000 .0859735 .1745327
2007 | .299032 .0245284 12.19 0.000 .2507585 .3473055
2008 | .4678728 .0282007 16.59 0.000 .4123719 .5233737
2009 | .5989009 .0332971 17.99 0.000 .53337 .6644318
2010 | .7459874 .0365586 20.41 0.000 .6740377 .8179371
2011 | .9167391 .0417369 21.96 0.000 .8345983 .99888
2012 | 1.015613 .04539 22.38 0.000 .926283 1.104944
2013 | 1.101845 .0466482 23.62 0.000 1.010039 1.193652
2014 | 1.164955 .0480918 24.22 0.000 1.070308 1.259603
2015 | 1.242972 .0506982 24.52 0.000 1.143194 1.342749
|
_cons | 8.671896 .4954934 17.50 0.000 7.696733 9.64706
------------------------------------------------------------------------------
四.静态(短)面板数据随机效应汇总
1、检验时间效应(混合效应还是 随机效应 )(检验方法:LM统计量) (原假设:使用OLS混合模型)
qui xtreg lngdp lnfdi lnie lnex lnim lnci lngp,re (加上“qui”之后第一幅图将不会呈现)
xttest0
可以看出,LM检验得到的P值为0.0000,表明随机效应非常显著。可见,随机效应模型也优于混合OLS模型。
2、使用MLE估计
xtreg lngdp lnfdi lnie lnex lnim lnci lngp,mle nolog
四.静态(短)面板数据组间估计量
组间估计量
xtreg lngdp lnfdi lnie lnex lnim lnci lngp,be
五.静态(短)面板数据固定与随机效应检验
检验固定效应模型or随机效应模型 (检验方法:Hausman检验)
原假设:使用随机效应模型(个体效应与解释变量无关)
通过上面分析,可以发现当模型加入了个体效应的时候,将显著优于截距项为常数假设条件下的混合OLS模型。但是无法明确区分FE or RE的优劣,这需要进行接下来的检验,如下:
Step1:估计固定效应模型,存储估计结果 Step2:估计随机效应模型,存储估计结果 Step3:进行Hausman检验
xtreg lngdp lnfdi lnie lnex lnim lnci lngp,re
est store re
xtreg lngdp lnfdi lnie lnex lnim lnci lngp,fe
est store fe
hausman fe re
(或者更优的是hausman fe,sigmamore/ sigmaless)
可以看出,hausman检验的P值为0.0000,拒绝了原假设,认为随机效应模型的基本假设得不到满足。此时,需要采用工具变量法或者使用固定效应模型。