查看原文
其他

一文读懂内生性专题(中)

数量经济学 数量经济学 2022-12-31

一文读懂内生性专题(上)


本文主要为大家介绍内生性处理中的相关检验,主要包括Hausman检验、过段识别检验、弱工具变量的检验。


1、Hausman检验


刚才我们讲到的是方程中的解释变量为内生变量,也就是发生了内生性,但是如何检验方程中的解释变量包含内生变量呢?因为如果方程中不包含内生变量,那么我们可以认为OLS估计是最好的,也就不需要在使用工具变量IV估计了。


Hausman检验的一个假设就是若解释变量具有内生性,则两种方法的估计量并不相同。通俗来说,就是Hausman检验是通过对内生解释变量与随机误差项相关的检验,来帮助我们判断一个变量是否为内生变量,原假设为Cov(X,ui)=0,意思是若X为外生变量。若是拒绝原假设,则说明内生性问题的存在,Hausman检验一般根据统计值的概率与0.05比较。


Hausman检验的基本语法格式为:

hausmanname-consistent [name-efficient] [, options]


其中hausman表示hausman检验,而name-consistent表示一直估计量的变量名,而name-efficient表示有效估计量的变量名,主意这两个变量名的顺序不能颠倒。Option选项的constant 表述包含常数项,默认不包含常数项,然后sigmamore表示统一使用更有效的估计量


然后基本的语法汇总为:

regy x1 x2

eststore ols

ivregress2sls y x1 (x2=z1 z2)

eststore iv

hausmaniv ols ,constant sigmamore


现在我们继续使用刚才所说的案例进行检验,检验的编程命令为:






上述hausman检验是建立在同方差假定成立的情况或者前提下,因此该命令后面没有物件标准误的选项,若是存在异方差的问题时,该检验不能成立,应该改用德宾--吴--豪斯曼,该检验的语法格式为: 

estat endogenous


2、过度识别检验


当我们遇见多个内生变量的时候,需要考虑工具变量的个数,以确保所有的变量都能被识别,也就是考虑工具变量的个数与内生变量的个数,这也就是一般所说的识别检验,这里主要分为三种,即工具变量的个数与内生变量的个数大小比较,小于,等于,大于。


如果工具变量个数少于内生变量个数,则无法进行 2SLS 估计,称为“不可识别”(unidentified);

如果工具变量个数正好等于内生变量个数,则称为 “恰好识别”(justidentified 或 exactly identified);

如果工具变量个数大于内生变量个数,则称为 “过度识别”(overidentified)。在恰好识别或过度识别的情况下,均可进行 2SLS 估计;而在不可识别的情况下,则无法进行。


在计量经济学方法研究以及应用中,一般需要恰好识别或者过度识别,虽然过度识别的情况比较多一些,另外这是进行工具变量法的必要条件;若是出现过度识别,则需要进行过度识别检验,也成为萨尔干巴斯曼检验,写作Sargan-Basman检验。


该假设的条件为所有有效的工具变量的个数与内生解释变量一样多,或者说是这个所有的工具变量都是外生的。


过度识别的命令为estat overid


若是Sargan-Basman检验的统计量对应的p值大于0.05,则认为所有的工具变量都是外生的,也就是有效的,反之则是无效的。


总结:过度识别检验其实一部分是为了检验工具变量的外生性,主要体现在检验工具变量是否与扰动项的相关性,即与扰动项不相关。


3、弱工具变量的检验


我们回顾一下,找到的工具变量需要能够很好的代表内生解释变量的信息,也就是工具变量与内生解释变量的相关性,若是内生解释变量与工具变量只存在微弱的相关性,这就存在弱工具变量问题了。如何检验呢,在2SLS后用estat firststage命令来检验若工具变量的问题,若是对应的统计量的概率值小于0.05,则认为工具变量是合适的,是一个较好的工具变量,反之则认为存在弱工具变量的问题 。


我们回顾一下,找到的工具变量需要能够很好的代表内生解释变量的信息,也就是工具变量与内生解释变量的相关性,若是内生解释变量与工具变量只存在微弱的相关性,这就存在弱工具变量问题了。如何检验呢,在2SLS后用estat firststage命令来检验弱工具变量的问题,若是对应的统计量的概率值小于0.05,则认为工具变量是合适的,是一个较好的工具变量,反之则认为存在弱工具变量的问题 。




上述弱工具变量的检验其实也是这个检验有效工具变量的另外一个条件,主要考察工具变量与内生变量的相关性。


命令为:

estatfirststage,all forcenonrobust


 

从上面可以看到 Shea'sVariable | Partial R-sq.的值为0.5473,但是F统计量的概率值为0,因此可以认为不存在弱工具变量的问题。

另外也可以采用对弱工具变量更不敏感的有限信息最大似然法进行检验,命令为:

 

发现与2SLS结果差不多,因此认为不存在弱工具变量的问题。


如果存在弱工具变量该怎么办?

1. 如果有很多工具变量,有部分强工具变量和部分弱工具变量,可以舍弃较弱的工具变量而选用相关性较强的工具变量子集。在stata中,可以使用ivreg2命令进行“冗余检验”,以决定选择舍弃哪个工具变量。(直观上,冗余工具变量是那些第一阶段回归中不显著的变量。)


2. 如果系数是恰好识别的,则你不能略去弱工具变量。在这种情况下,有两个选择: 第一个选择是寻找其他较强的工具变量。(难度较大)

第二个选择是利用弱工具变量继续进行实证分析,但采用的方法不再是2SLS。而是对弱工具变量不太敏感的有限信息极大似然法(LIML)。在大样本下,LIML 与2SLS是渐近等价的,但在存在弱工具变量的情况下,LIML 的小样本性质可能优于2SLS。 LIML的 Stata 命令为 ivregress liml depvar[varlist1] (varlist2 =instlist)


4、GMM估计


如果存在异方差,则可以使用比2SLS更有效率的GMM估计来进行估计,命令为:



GMM估计的命令为:

ivregress gmm rent pcturban (hsngval = faminci.region)


进行过度识别检验



5、面板数据IV估计


1、检验内生性是否存在


由于面板数据在固定效应模型中存在内生性问题,所以Hausman-Wu检验,语法格式为:


hausman fe feiv ,constantsigmamore


其中fe为进行固定效应的保存回归结果,feiv表示面板数据的iv估计结果


2、面板数据工具变量法的IV估计的语法格式为:


GLS random-effects (RE) model

xtivreg depvar [varlist_1] (varlist_2 = varlist_iv)[if] [in] [, re RE_options]

Between-effects (BE) model

xtivreg depvar [varlist_1] (varlist_2 =varlist_iv) [if] [in] , be [BE_options]

Fixed-effects (FE) model

xtivreg depvar [varlist_1] (varlist_2 =varlist_iv) [if] [in] , fe [FE_options]

First-differenced (FD) estimator

xtivreg depvar [varlist_1] (varlist_2 =varlist_iv) [if] [in] , fd [FD_options]


然后首先进行IV估计的命令为xtivreg,然后后面变量一样,加上fe,然后进行过度识别检验命令为:xtoverid


3、弱工具变量检验


use http://fmwww.bc.edu/ec-p/data/macro/abdata.dta

 (Layard& Nickell, Unemployment in Britain, Economica 53, 1986, from Ox dist)

tsset id year

 (xtivregvs. xtivreg2, fixed effects)

xtivreg2 ys k (n=l2.n l3.n), fe small

xtivreg ys k (n=l2.n l3.n), fe small

(xtivreg2 vs. ivreg2 vs. xtivreg,first-differences)

xtivreg2 ys k (n=l.n l2.n), fd small first

ivreg2 d.ys d.k (d.n=ld.n ld2.n), small first

xtivreg ys k (n=l.n l2.n), fd small


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存