“ 你的整篇论文都依赖于你的工具变量的外生性,那么你的工具变量究竟是否外生呢……
”
工具变量的本质特征是外生性,即工具变量与扰动项不相关。如果工具变量外生,且为强工具变量,则工具变量法的逻辑必然成立,可得到回归方程的一致估计。由于工具变量的相关性易检验(比如,考察第一阶段回归的 F 统计量),而工具变量的外生性不易检验,故对于使用 IV 的实证论文,工具变量的外生性常常成为审稿人、主编与作者的分歧焦点。如果工具变量本身 “不干净”(与扰动项相关),则通过工具变量分离出来的内生变量之 “外生部分” 也必然 “不干净”。
具体来说,如果工具变量内生,则 2SLS 的第一阶段回归拟合值也内生(此拟合值是工具变量的线性组合),将此拟合值代入第二阶段回归,则必然导致 2SLS 不一致。如果检验工具变量的外生性?在恰好识别的情形下(工具变量个数等于内生变量个数),目前尚无严格的统计检验,只能进行定性讨论。以一元回归为例:
其中, 为内生解释变量,与扰动项 相关。假设找到某潜在工具变量 ,与内生变量 相关,且 可能与扰动项 不相关。由于 不可观测,如何判断 是否与 相关?
首先,由于 是被解释变量 扰动项,故可从工具变量 与 的相关性入手考察。
其次,由于 与 相关,而 影响 ,故 会通过 而影响 ,参见上图。
最后,如果外生性成立,即 与 不相关,则 不可能通过 而影响 。
另一方面,根据定义,扰动项 为除 以外,所有影响 的其他因素。因此,如果 满足外生性,则 不可能通过除 以外的任何其他因素或渠道影响 ,这被称为 “排他性约束”(exclusion restrictions)。通过排他性约束来定性探讨工具变量的外生性,在实践中需要将 影响 的所有可能渠道一一列出,然后将除 以外的渠道全部排除(比如,通过讨论认为这些其他渠道不存在或可以忽略)。如果发现 可能通过另一渠道 而影响 ,则一种解决方法是将 作为控制变量也放入回归方程中。然而,如果 不可度量,则工具变量 的外生性便是可疑的。Miguel et al. (2004) 使用 41 个非洲国家在 1981-1989 年的面板数据,以降雨变化(rainfall variation)作为工具变量,研究经济增长对于内战的因果作用,即经济萧条或引发内战。
首先,由于内战也会影响经济增长,故存在逆向因果,导致内生性。其次,这些非洲国家当时均为农业国,且其农业主要依靠自然降雨(rain-fed agriculture),故降雨变化与 GDP 增长相关,满足工具变量的相关性。在一般意义上,常识认为天气冲击是外生的,因为人类活动通常无法影响天气。然而,这并不意味着,天气在计量的意义上就一定是外生的,因为天气依然会影响人类活动,故仍可能与扰动项相关。具体来说,Miguel et al. (2004, p.745) 考察了以下几种可能违反排他性约束的情形。第一,降雨变化可能影响收入不平等或农村贫困率,进而引发内战。尽管缺乏收入不平等与农村贫困率的数据,作者发现降雨变化与中央政府税收没有显著关系(政府预算或影响收入分配与农村贫困)。第二,水灾可能会摧毁公路网,使得政府军更难控制叛军,从而加剧内战。然而,在简化式回归中,降水越多则内战越少,故如果存在此偏差,则只会低估经济增长对内战的影响,使得 IV 估计值成为真实效应的下限。第三,降雨可能使得敌对双方难以交战,比如,降雨使得交通条件恶化。然而,作者发现,降雨变化对于可用的公路网并无显著影响。第四,降雨太少可能意味着热浪,使得人们脾气焦躁而易于开战。然而,回归结果表明,内战与滞后一年的经济增长及降雨关系最为密切,而一年时间已足够让头脑发热的人们冷静下来。最后,作者谦卑地承认,无法在根本上完全排除降雨变化通过其他渠道影响内战,但相信其他渠道的作用可能并不大。在过度识别的情况下,则可以进行 “过度识别检验”(overidentification test)。考虑以下原假设:
在过度识别的情况下,工具变量个数多于内生变量个数(比如,2 个 IV 对 1 个内生变量),故事实上存在多种 IV 估计量(比如,仅使用第 1 个 IV,仅使用第 2 个 IV,或同时使用两个 IV)。如果原假设成立(即所有 IV 都有效),则所有的 IV 估计量都将收敛到相同的真实参数,故这些 IV 估计量之间的差别将在大样本下消失,可进行豪斯曼检验(Hausman Test)。但这样做显然太麻烦,因为要比较的 IV 估计量可能较多。因此,传统的方法是进行 Sargan 检验。记 2SLS 的残差为 ,并以此残差作为不可观测的扰动项 的代理变量。为了考察 与工具变量的相关性,将残差 对所有外生变量(含工具变量与外生解释变量)进行 OLS 回归。显然,如果此辅助回归的拟合优度 越高,则工具变量对于 2SLS 残差 的解释力就越强,使得 “工具变量与扰动项不相关” 的原假设越不可能成立。可以证明,在原假设成立的条件下,如下定义的 Sargan 统计量服从渐近卡方分布:其中, 为样本容量, 为外生变量个数(含工具变量与外生解释变量), 为待估参数个数(含内生变量与外生解释变量),故自由度 为过度识别的个数。
传统 Sargan 检验的缺陷是它仅适用于同方差的情形。为了得到异方差稳健的过度识别检验,可使用沃尔德检验(Wald Test)原理来构造检验统计量。记所有工具变量所构成的向量为 (包含工具变量与外生解释变量),则所有工具变量皆外生的原假设可写为以下 “总体矩条件”(population moment conditions):即工具变量 与扰动项 正交。根据样本数据,可得其相应的 “样本矩”(sample moments),记为 ,其中下标 表示样本容量;而且如果总体矩条件正确,则样本矩也应该离 向量不远: 其中,二次型矩阵为样本矩 之协方差矩阵估计量的逆矩阵。
事实上,在过度识别的情况下,通常使用更有效率的广义矩估计(Generalized Method of Moments,简记 GMM)。故现在一般使用 GMM 的 Hansen's J 统计量来进行过度识别检验,原理与上述 Wald 检验类似。关于 GMM,将在工具变量法(四)的完结篇介绍。需要特别说明的是,无论使用何种过度识别检验,都有一个不检验的大前提(maintained hypothesis),即模型至少是恰好识别的。因此,即使检验结果接受了 “所有工具变量皆外生” 的原假设,也并不表示就证明了所有工具变量的外生性。它只是表明,在模型恰好识别的情况下,多余的那些工具变量也是外生的。总之,根据目前的计量经济学,工具变量的外生性在本质上依然是不可检验的,学者们仍需围绕 “排他性约束” 而进行定性讨论,甚至无休止的争论。工具变量完全外生的情形毕竟只是一种理想状态。现实中的工具变量更可能存在轻微的内生性。考虑以下半简化式方程(semi-reduced form equation),即将工具变量 也放入原模型中:如果工具变量 仅通过内生变量 影响 (即满足排他性约束),则在上式中, 。如果 ,则表明 存在内生性。如果 接近于0,即 ,则说明工具变量 存在轻微的内生性,被 Conley et al. (2012) 称为 “近乎外生”(plausibly or approximately exogenous)。不难看出,此 正是工具变量 与扰动项的相关系数:传统的工具变量法对于 “ ” 持有很强的先验信念(prior belief),甚至是教条式的、宗教式的信念。然而,现实中的工具变量更可能只是近乎外生的,即 (由于只是微弱内生,IV 估计量的偏差仍然小于 OLS,故 IV 估计量仍有其价值)。
如果研究者能给出 的取值范围(support)或先验分布(prior distribution),则 Conley et al. (2012) 表明,可以根据 的这些先验信息来构造回归系数 的置信区间。作者还提供了相应的 Stata 程序 plausexog,下载方法为 ssc install plausexog。类似地,Kraay (2012) 也使用贝叶斯估计的方法来考察在 “排他性约束不确定”(uncertain exclusion restrictions)的情况下如何进行统计推断。 Berkowitz et al. (2012) 则直接考察工具变量与扰动项的相关性,并假设对于几乎外生(nearly exogenous)的工具变量而言,这种相关性在大样本下消失,即所谓 “渐近正交性”(asymptotic orthogonality);然后使用一种 “部分再抽样”(fractional resampling)的技术,将检验内生变量系数 显著性的 Anderson-Rubin 检验(简记 AR)推广至工具变量几乎外生的情形,称为 “FAR 检验”。Requele et al. (2013) 提供了相应的 Stata 程序 far,可在 Stata 中输入 “findit far” 搜索下载。或许在未来,经济学家将越来越接受工具变量微弱内生的现实,而学会如何使用几乎外生的工具变量进行统计推断。
学习知识有三个境界。一种境界是学过,不久便只剩下模糊的印象,未知所以然,考完试早就还回去了。另一种境界是用过,此时方知所学漏洞百出,捉襟见肘,有识之士难免困而学之,一顿恶补。第三种境界则是玩过,就像小孩完全沉醉于其玩具,各种把玩摆弄,浑然没有任何功利的目的,……
____________________________
Berkowitz, Daniel, Mehmet Caner, and Ying Fang, "The Validity of Instruments Revisited," Journal of Econometrics, 2012, 166, 255-266.Conley, Timothy G., Christian B. Hansen, and Peter E. Rossi, "Plausibly Exogenous," Review of Economics and Statistics, 2012, 94(1), 260-272. Kraay, Aart, "Instrumental Variables Regressions with Uncertain Exclusion Restrictions: A Bayesian Approach," Journal of Applied Econometrics, 2012, 27, 108-128. Miguel, Edward, Shanker Satyanath and Ernest Sergenti, "Economic Shocks and Civil Conflict: An Instrumental Variables Approach," Journal of Political Economy, 2004, 112(4), 725-753. Riquelme, Andres, Daniel Berkowitz, and Mehmet Caner, "Valid Tests when Instrumental Variables Do not Perfectly Satisfy the Exclusion Restriction," The Stata Journal, 2013, 13(3), 528-546. 陈强,《高级计量经济学及Stata应用》,第2版,高等教育出版社,2014年。陈强,《计量经济学及Stata应用》,高等教育出版社,2015年。
►一周热文
数据呈现丨小白学数据可视化:一个ggplot2画图完整实例
老姚专栏丨均值回复及其对实证研究的启示
数据呈现丨R语言做多变量可视化分析?
统计计量丨工具变量法(二): 弱工具变量
数据呈现丨R语言机器学习中数据可视化的杀手锏
数据资源丨划重点 ! 经济学专业学习Python之爬虫篇
统计计量丨古老而神秘的因子分析(二)
这里是大数据、分析技术与学术研究的三叉路口
作者:陈强出处:计量经济学及Stata应用推荐:杨奇明编辑:青酱