一文读懂动态面板数据xtabond、xtdpdsys、xtdpd
The following article is from 计量经济学 Author 小计量
来源:计量经济学
转载已获授权
动态面板数据模型
对于面板数据而言,如果出现了被解释变量随时间而改变,则开启了动态面板对参数估计的可能性,动态面板设定额一个个体的被解释变量部分取决于前一期的值,因此需要谨慎对待,因为滞后被解释变量和序列相关的误差项会导致模型估参数的不一致。
当被解释变量的一期或者多期都包含在解释变量中,对这种数据进行估计。如果估计固定效应,需要进行的是一阶差分而不是通过均值来消除个体效应,通过解释变量的滞后期作为工具变量对一阶差分模型中的参数进行IV估计,可以得到参数的一致估计量。主要使用的命令有xtabond、xtdpdsys和xtdpd。
1、认识面板动态模型
模型如下:
与静态模型进行比较,一阶差分数据的OLS模型回归将不能够得到一致的参数估计,即使不存在序列相关问题,因为与存在相关性。对于存在序列相关的,固定效应模型的误差项和是相关的,因为取决于。但是对于k>=2时,和是不相关的,因此也就可以使用IV进行估计,即将作为内生解释变量,更多滞后期作为其工具变量,则开启了工具变量估计的可能性。
2.1、AR(2)的动态面板模型
首先看一个lnwage的Ar(2)模型
从上图可以看到,只包含工资滞后两期的模型中,样本量的损失为3*595(因为是差分),一共包含15个工具变量。并且系数显著,可以说明,工资取决于过去的工资水平。
使用量解读那GMM(最优GMM)
从以上的模型可以看到,系数并没有发生很大的变化,标准误也没有发生很大的变化,说明GMM估计并没有提高效率。
但是对于T较大的面板数据,使用上述的估计命令,会导致产生工具变量,会导致很差的渐进估计量,从而形成过度识别的问题,所以对工具变量加以限制,使用选项(maxldep)。
上文使用了maxldep选项,仅仅生成解释变量滞后一期作为工具变量,所以产生了5个工具变量。估计参数的标准差变大,估计效率的损失也很大,可以尝试maxldep(2)的选项的结果,工具变量变为9个,结果变得更好。
2.2加入其它解释变量
使用最优的GMM或者两阶段GMM来估计参数。严格外生的变量作为常规的解释变量。先决变量和内生变量都需要制定在特定的选项中,同时需要将当做工具变量使用的变量进行数量限制。
从以上的结果可以看到,此处使用了40个工具变量,pre(wks,lag(1,2))表示wks的当期和滞后一期作为解释变量,另外两个滞后期作为工具变量(滞后二期和三期),endogenous(ms,lag(0,2))当期作为解释变量,另外最多有两个滞后期作为工具变量。
2.3模型相关检验
为什么滞后一期是相关的,滞后多期不相关estabond命令的检验原理:
检验得到滞后一期是相关的,滞后2期不相关。所以模型设置是合理的。
过度识别检验
在上文中,估计了11个参数,但是有40个工具变量,因此有29个过度识别约束,过度识别检验不能设置VCE选项。结果如下:
3、xtdpdsys命令
Arellano-bond估计量使用的IV估计量是基于以下假设:
当时,有因此被解释变量的滞后变量都可以作为模型的工具变量。但是有相关文献认为应该使用其他的矩条件来获得估计精度更高和有限样本性质更好的估计量。Arllano和Bover(1995)与Blundell和Bond(1998)认为,应该使用其他条件,并且把差分作为工具变量使用,同时对内生性和先决变量也增加了类似的矩条件,且把其一阶差分当做工具变量使用。
上文使用了xtdpdsys命令,使用了60个工具变量。虽然工具变量增多了,但是模型的标准误降低了10%-60%,他反映了模型的精度提高,因为模型使用了另外的矩条件。
4、Xtdpd命令
Xtdpdsys命令要求模型的误差项不存在序列相关,如果该假设被拒绝(使用estat abond命令检验),一种可行的方法就是把更多被解释变量的滞后期作为解释变量,通过此方法消除误差项中的任何序列相关。
因此Stata也提供了另外一种命令xtdpd,它允许遵循低阶的移动平均(MA)过程,并且允许先决变量有更加复杂的结构。
语法格式 xtdpd depvar [indepvars] [if] [in] , dgmmiv(varlist [...]) [options]
Xtdpd把所有的变量和工具变量引入模型中(滞后被解释变量、外生变量、先决变量和内生变量),之后使用选项设定工具变量。div()选项设定外生解释变量、dgmmiv()选项设定内生解释变量,并且说明每个解释变量的滞后期作为工具变量,lgmmiv()选项设定水平形方程工具变量。