吾日三省吾身:内生性问题及其解决方案
点击蓝字关注我们
内生性问题具体指的是在回归分析中,解释变量和误差项存在相关关系。内生性问题会使用样本估计的参数偏离总体的真实参数,我们无法得到变量之间真实的因果效应。内生性问题是计量经济学中必须重视无法回避的问题,贯穿计量经济学体系的始终,也是审稿人最容易质疑的问题。我们每天都在与内生性问题作斗争,古有孔夫子“吾日三省吾身”,今天我们同样需要三省,我们的paper或者他人的paper是否存在内生性问题?具体是哪种内生性问题?应该选用什么方法来解决内生性问题?
一、内生性问题的来源
(1)遗漏变量偏差
遗漏变量偏差是指模型设定中遗漏了某个或某些解释变量,并且遗漏的变量还与模型中的解释变量相关而导致的误差。比如在教育回报率的OLS估计中,遗漏了不可观测的能力,能力会影响个体的教育选择,也会影响个体的收入水平。这样,在劳动力市场上观察到的教育对收入的正向影响(即一般OLS估计的结果),很可能包含能力因素(而不能完全归于教育)的影响。
遗漏变量是不可避免的问题,因为我们不可能找到所有会影响被解释变量的因素,但只要遗漏的变量与解释变量不相关就万事大吉,因为这种情形不会导致估计不一致。
(2)双向因果关系
双向因果是指解释变量与被解释变量互为因果,这样也会使解释变量与误差项相关,造成内生性问题。设想我们设定了如下的线性回归模型:
但被解释变量y_i也会反过来会影响解释变量x_i:
联立两个方程,我们就能得到:
这样,第一个方程中的解释变量x_i与误差项u_i相关,因此存在内生性问题。
双向因果关系的实例很多。例如,经济萧条可能引起内战,但内战也会导致经济停滞。再例如,地价影响房价,房价也会影响地价。
(3)测量误差偏差
测量误差是指由于对变量测量不准确而导致的误差,比如我们要测量的自变量的真实值为x_i,结果测量存在误差,导致测量值为x_i^*,测量值除了包含真实值x_i外,还包含一个误差项v_i。这样也会使解释变量与误差项相关,造成内生性问题。假设真实的回归模型是:
由于
原方程变为
整理得到
这样,由于测量值x_i^*与误差项v_i相关,上式中解释变量x_i^*与复合误差项(u_i-β_1 v_i)相关,因此存在内生性问题。
(4)动态面板偏差
动态面板偏差是指解释变量中因为包含了被解释变量的滞后项而带来的偏差。当模型纳入被解释变量的滞后项作为解释变量,由于被解释变量的滞后项与误差项的滞后项相关,在误差项存在自相关的情况下,误差项与误差项的滞后项相关,使被解释变量的滞后项与误差项相关,进而导致内生性问题。
二、内生性问题解决方案
(1)遗漏变量偏差:面板数据模型、工具变量(IV)、双重差分法(DID)、断点回归设计(RDD)、随机实验或自然实验、倾向得分匹配(PSM)、Heckman选择模型
(2)双向因果关系:工具变量(IV)
(3)测量误差偏差:工具变量(IV)
(4)动态面板偏差:差分GMM、系统GMM
参考资料:
[1]王宇,李海洋.管理学研究中的内生性问题及修正方法[J].管理学季刊,2017,2(03):20-47+170-171.
[2]陈强.高级计量经济学及Stata应用[M].北京:高等教育出版社,2014.
点击阅读原文即可留言
公众号 : Kungfu_econometrics
喜欢请帮忙点个在看,感谢大家的支持!