内生性问题研究:4篇推荐与8点认识
来源:刘西川阅读写作课
纵观当前国内经验实证研究领域,似乎不关注或提及一下内生性问题,就不够时髦,做出来的作品也就难以登上大雅之堂。随手翻阅一些近期的经济管理类期刊上的论文,十有八九都和内生性问题有关;甚至有些审稿专家一上来就看文章是否关注了内生性问题,在他们眼里,缺少了这方面的考虑就是不够专业、严谨和前沿。十多年前,接触内生性及工具变量这些内容,还是从陆铭老师的一篇文章中看到的。陆老师在文中借助大神Acemoglu的经典论文普及了寻找工具变量的思路及依据。为了致敬那个纯真治学的青春年代,我现将他当年写的这段文字摘录于此:“Acemoglu等人(2001)的文章是非常有代表性的使用工具变量的论文。他们试图验证制度对人均收入有影响,显然,直接做回归的话,制度就是内生的,因为好的制度可能在人均收入高的地方产生。他们找的工具变量是殖民地时代一个国家的死亡率,死亡率高欧洲人就不会定居下来,于是就会在当时建议掠夺性的制度,反之就会建立好的制度,而那时的制度对现在仍然有影响。”
由此看来,内生性问题之于计量教科书中的核心地位以及在因果识别与推断过程中的棘手性是不可否认的。为此,了解、学习内生性问题及工具变量法,积累已有的知识是绝对有必要的:一方面,至少在微观计量经济学中,整个教科书都是围绕内生问题及其解决的思路来展开的。另一方面,在某个具体研究领域,了解前辈、同仁已有的认知、做法和探索,知己知彼,博采众家之长也不是什么坏事;有些时候,就是因为自己知道的太少了,做出来的东西就不够高大上和精致。
在日常教学和研究当中,我发现有些人对内生性问题与工具变量法都是人云亦云、跟风,还有一些人属于没有真正做过,不知道其中的深浅。从全面和实战的角度,我强烈推荐以下四篇综述性论文。第一篇论文(陈云松、范晓光,2010)将目标定位于因果关系,总结内生性问题的4个来源以及相对应的识别策略。第二篇论文(陈云松、范晓光,2011)与上一篇不同,通过引入具体的研究实例——社会资本的劳动力市场效应,概括相关研究中的内生性问题和模型识别策略;此外,该文提出的模型设置、数据搜集纵向跨度、横向跨度、外生变量挖掘、研究假定说明和复制性研究等六大努力方向对其他领域研究也有启发和借鉴意义。第三篇论文(陈云松,2012)至少有三点值得细细品味:(1)工具变量法发挥作用的原理及其在因果推断框架中的位置。(2)提供了5种探寻工具变量的方向及其相关实例。(3)引入局部干预效应问题,并用实例来演示相关论断。最后一篇,即第四篇论文(王宇、李海洋,2017)属于管理学领域,在这篇文章中,作者总结了5种内生性来源和6种内生性问题修正方法;其中特别强调,不同来源的内生性问题需要不同的修正方法,这就好比吃面要用筷子,喝汤要用勺子一样。
这篇推文分为两部分:第一部分的目标是推荐这个领域的4篇综述性问题。第二部分是围绕内生性问题和工具变量法谈谈自己的认识体会,其中涉及到了:内生性问题的根源、具体表现形式等;工具变量缓解内生性问题的思路以及如何寻找工具变量;弱工具变量问题;局部干预效应问题,等等。
1、陈云松、范晓光:《社会学定量分析中的内生性问题测量社会互动的因果效应研究综述》,《社会》第30卷,2010年第4期。
摘要:因果关系是社会学分析的核心议题。然而,基于调查数据的定量分析都会受到内生性问题的困扰,从而往往难以作出恰当的因果性推断。大量现有的社会学定量分析虽以揭示为己任,但实质上要么仅仅停留在描述性统计相关阶段,要么得出错误的因果性结论。本文以社会互动研究为例,详细讨论了遗漏偏误、自选择偏误、样本选择偏误和连理性偏误等四种的内生性问题的来源,并介绍了克服内生性问题的一系列模型识别方法。最后还基于中国综合调查(CGSS2003)问卷,提出了通过提高调查数据信息量以克服内生性问题的可能性。
论文目录
一、内生性问题来源
(一)一般性遗漏变量偏误
(二)自选择偏误
(三)样本选择偏误
(四)联立性偏误
二、模型识别的策略选择
(一)解决遗漏变量偏误
(二)解决自选择偏误
(三)解决样本选择偏误
(四)解决联立性偏误和映射问题
(五)数据收集问题
三、结语
2.陈云松、范晓光:《社会资本的劳动力市场效应估算——关于内生性问题的文献回溯和研究策略》,《社会学研究》2011年第1期。
摘要:内生性问题是社会科学定量分析面临的重要挑战之一。如何通过不同的模型识别策略来消减内生性问题,判定因果关系,成为近年西方社会资本研究领域的前沿议题。本文围绕社会资本的劳动力市场效应,从“使用社会关系”、“使用了的社会资本”和“可使用的社会资本”这三条主线,重点回溯了相关研究中的内生性问题和模型识别策略。最后,本文提出了今后社会资本实证研究中模型设置、数据搜集纵向跨度、横向跨度、外生变量挖掘、研究假定说明和复制性研究等六大努力方向。
论文目录
一、引言
二、内生性偏误及模型识别策略举要
(一)遗漏变量偏误
(二)自选择偏误
(三)样本选择偏误
(四)联立性偏误
三、相关文献中的内生性问题及其应对
(一)“使用社会关系”的因果效应
(二)“使用了的社会资本”的效应
(三)“可使用的社会资本”的效应
1.“可使用的社会资本”的外生效应
2.“可使用的社会资本”的内生效应
四、解决内生性问题的研究策略
3.陈云松:《逻辑、想想和诠释:工具变量在社会科学因果推断中的应用》,《社会学研究》2012年第6期。
一、导言:因果推断的圣杯
二、工具变量的原理:模型之外的力量
三、工具变量的寻觅:逻辑和想象
(一)来自“分析上层”的工具变量:集聚数据
(二)来自“自然界”的工具变量:物候天气
(三)来自“生理现象”的工具变量:生老病死(四)来自“社会空间”的工具变量:距离和价格
(五)来自“实验”的工具变量:自然实验和虚拟实验
四、工具变量估计量的诠释:局部干预效应问题
五、工具变量分析实例:社会网、选择性交友与求职
六、结语:局限抑或潜力?
4.王宇、李海洋:《管理学研究中的内生性问题及修正方法》,《管理学季刊》2017年第3期。
摘要:鉴于内生性问题(endogeneity)对研究结果的严重偏差,管理学者越来越重视对内生性问题的检验和修正。然后,国内许多管理学学者对内生性问题的来源和修正方法仍然缺乏系统的了解。在本文中,我们回顾了管理学顶级期刊Academy of Management Journal, Strategic Management Journal和Administrative Science Quarterly在2007-2016年发表的所有提及内生性问题的文章共223篇。在这223篇文献中,我们整理出内生性问题的主要来源和修正方法,并结合现有的内生性理论和方法文献,对不同来源的内生性问题如何进行相应的修正给出了具体建议。
论文目录
一、引言
二、研究方法
(一)样本
(二)编码
三、内生性问题的来源
1.遗漏变量偏差
2.选择偏差
3.双向因果
4.动态面板偏差
5.测量误差
四、内生性问题修正方法
(一)工具变量法
(二)Heckman两阶段模型
(三)Arellano-Bond差分GMM估计、水平GMM估计和Arellano-Bover/Blundell-Bond系统GMM估计
(四)双重差分分析(difference in difference analysis)
(五)倾向得分匹配(propensity score matching)
(六)固定效应模型方法(fixed effect model)
五、不同来源的内生性问题需要不同的修正方法
(一)针对遗漏变量偏差引起的内生性问题的修正方法
(二)针对选择偏差引起的内生性问题的修正方法
(三)针对双向因果引起的内生性问题的修正方法
(四)针对动态面板引起的内生性问题的修正方法
(五)针对测量误差引起的内生性问题的修正方法
六、讨论
01、内生性问题的含义、产生根源及具体表现形式
1.把握内生性问题的两种思路。
一般有两种思路:(1)遗漏说,即关注的遗漏变量。“如果一个重要变量被所估计的模型遗漏了,而且该变量与模型右侧中的核心自变量也相关,那么那该变量的估计系数就必然是有偏的。此时,这个核心自变量被称为是内生,这也就是著名的内生性问题(陈云松,2012)。”(2)相关说,即关注的是与误差项的关系。如果某个核心解释变量与误差项相关,我们则称为存在内生性问题(王宇、李海奇,2017)。这两种思路,前者注重于变量可能遗漏,后者则强调于从观测和非观测角度来把握症状。
2.产生根源。陈云松、范晓光(2010)将内生性问题的来源概括为4类:一般性遗漏变量偏误、自选择偏误、样本选择偏误、联立性偏误。王宇、李海奇(2017)将内生性问题的来源概括为5类:遗漏变量偏差、选择偏差、双向因果、动态面板和测量误差。
3.内生性问题是怎么回事,要具体,至少要能从计量模型方面讲清楚。在这面,陈云松、范晓光(2010)揭示了内生性问题的四种表现形式是,具体如下:其一、对模型(1)、(2)和(3)的比较,可以揭示一般性遗漏变量偏误的存在。其二、对模型(4)和(5)的比较分析,可以揭示自选择偏差的存在,自选择问题的实质是两个过程的非观测因素相互关联。其三、对模型(6)、(7)和(8)的对比分析,可以揭示样本选择偏差的存在;当因变量的观察仅仅局限于某个有限的非随机样本时,样本的选择偏误就容易产生,也就是说,(7)估计的是某个子样本,而(8)估计的是总体样本。其四、对模型(9)、(10)、(11)和(12)的对比分析,可以揭示联立性偏误;联立性偏误的本质就是解释变量连带地由因变量决定。
4.对内生性问题的把握还要能从经验上讲得通。在这个方面,可以揣摩陈云松、范晓光(2010)的具体例子。第一、针对一般性遗漏变量偏误,提供的例子是:“要估计找熟人相对于不找熟人对于求职的因果影响,其中可能在模型中将个体的口才遗漏掉了”。第二、针对自选择偏误,提供的例子:“找熟人相对于不找熟人的求职效应”,以及将社会网的作用纳入进来的考虑。第三、针对样本选择偏误,提供的例子是“估计使用了的社会资本的因果效应,其中引入了自尊心”。第四、针对连理性偏误,提供的例子是“估计可使用的社会资本的效应”。
何以说工具变量是定量分析中因果推断的“圣杯”?陈云松(2012)对此的阐释是:好的工具变量非常难以寻觅,寻找它的逻辑和数据挖掘过程充满艰辛、难以驾驭,甚至往往需要研究者的灵感。但它在模型上的简洁性,它对社会科学想象力、逻辑和诠释力的要求,既为定量分析提供了因果推断的重要武器,也让分析的过程充满趣味和奇思妙想。
1.原理。要解决这一内生性问题,我们需要引入更多信息来进行无偏估计。工具变量的方法就是引入一个外生变量,且必须满足以下两个条件:与不相关,但与相关。或者说,仅仅通过影响来影响。陈云松(2012)通过一个示意图,清晰地展示了工具变量的原理:利用来自模型之外的外生差异进行无偏估计。
2.思路。王美金、林建浩、胡毅(2012)总结了大多数研究的操作步骤:第一步,根据理论分析、直观判断或者已有文献结论,指出实证分析或所估计的计量模型中存在内生性问题;第二步,针对内生解释变量,选取研究者认为合适的工具变量进行估计;第三步,利用Hausman经验,验证模型的内生性问题,如果拒绝了原假设,则认为该研究所提出的内生性问题确实存在,所使用的工具变量估计也是合理的。
具体而言,要确保工具变量分析结果稳健可信,研究者必须首先检验工具变量的合法性,同时还要观察工具变量模型和一般的单方程模型(如OLS或Probit模型)之间的分析结果有无系统差异。在这个方面,至少要完成的检验或判别是(以下内容摘录自陈云松(2012)):第一、和必须是强相关的。否则,就会带来弱工具变量问题,导致估计有偏。在使用二阶段估计时,一般借助F统计量来判断二者之间的关系强弱,F统计量的经验值为10(Stock & Yogo,2005)。第二、工具变量的外生性是无法用统计方法直接验证的。但当同时使用多个工具变量时(也即模型被多度识别时),则可以进行沙根检验(Sargan Test)。第三、豪斯曼内生性检验(Hausman Test),用以检测OLS模型和工具变量模型之间是否存在系统性差异。如果有,则应采纳工具变量估计量。第四、瓦尔德内生性检验(Wald Test),用以检测单方程Probit模型与IV-Probit模型之间是否存在系统差异。如果有,则应采纳IV-Probit模型估计量。(小结:1.应明白F检验、Sargen test、Hausman test和Wald Test的使用目的;2.应能区分Hausman test和Wald Test针对的不同情形。)
3.弊端。工具变量法可能带来的不利结果也需要警惕。姜纬教授对JF、JFE和RFS三大金融顶级期刊中255篇运用工具变量进行回归估计的论文进行研究发现,工具变量估计法将回归估计系数平均扩大了9倍。
针对工具变量回归估计所带来的扩大效应,姜纬教授从以下三个方面寻找原因:首先,“局部平均处理效应”(LATE)有可能使工具变量法估计的系数被扩大。其次,弱工具变量也可能使得工具变量估计系数放大。第三,发文导向也可能导致已发表的论文中工具变量估计系数普遍偏大。
这样看来,工具变量也许并没有让我们更接近事实。对此,姜纬教授提出了三点建议:第一、研究者应该对内生性问题进行更详尽的分析。比如内生性问题的大小以及如何影响估计系数(正向或是负向)。比较可行的办法是对样本进行分组,对不同子样本的回归结果进行分析有助于找出内生性问题对原有估计的影响机制与效果。第二、研究者应该正视工具变量的效能。例如,如果是弱工具变量,即使通过了弱相关检验,其估计系数也会偏离其真实系数,这是研究者需要时刻谨记的。第三、研究者应该结合事实来做分析推断。例如,关于双层股权与掏空的研究,如果运用工具变量研究发现大股东与管理层利用此股权结果进行讨论并损害了5%的公司价值,那这并不稀奇。但是当研究结果表明,损害了50%甚至100%的公司价值时,那就必须要警惕了。
陈云松(2012)认为,解决内生性问题的常见方法,主要包括工具变量(instrumental variable, 简称IV)、固定效应模型(fixed effect model,简称FE)、倾向值匹配(propensity score matching,简称PSM)、实验以及准实验(experiments and quasi-experiments)等等。
陈云松、范晓光(2011)总结了4类内生性偏误及模型识别策略。具体如下:(1)经验研究中主要有四种方案用于缓解遗漏变量偏差问题。第一种方法是用非传统数据作为遗漏变量的替代以控制潜在的遗漏变量。第二种方法依赖于同一个被访者的自变量和因变量在时间维度上的差异,运用固定效应模型去消除实践固定的非观测因素。第三种是利用非时间性的组内差异去估计固定效应模型。第四种是使用工具变量。(2)在实证研究中,主要有三种矫正自选择偏误的方法。第一,随机分配是解决问题的最佳途径。第二种矫正自选择偏误的方法是匹配。第三种方法是建立选择方程的正式模型,建立基于选择模型和实质模型的联立方程组是一种矫正自选择偏误的简明方法。(3)被广泛用来解决样本选择问题的方法是赫克曼的二阶段方法。(4)总体而言,增加排除限制,也即寻找工具变量是解决联立性问题的最佳方法。
王宇、李海奇(2017)总结概括了6种内生性问题修正方法,即:工具变量法、Heckman两阶段模型、Arellano-Bond差分GMM估计、水平GMM估计和Arellano-Bover/Blundell-Bond系统GMM估计,双重差分分析(difference in difference analysis)、倾向得分匹配(propensity score matching)和固定效应模型方法(fixed effect model)。
王宇、李海奇(2017)总结概括了6种内生性问题修正方法,即:工具变量法、Heckman两阶段模型、Arellano-Bond差分GMM估计、水平GMM估计和Arellano-Bover/Blundell-Bond系统GMM估计,双重差分分析(difference in difference analysis)、倾向得分匹配(propensity score matching)和固定效应模型方法(fixed effect model)。
他山之石可以攻玉!前人使用过的工具变量无疑就是黑漆漆夜里的那一束亮光,在很大程度上对我们今后寻找工具变量带来重要启发甚至神来一笔的灵感。
陈云松(2012)总结了寻觅工具变量的5种思路。即:(一)来自“分析上层”的工具变量:集聚数据;(二)来自“自然界”的工具变量:物候天气;(三)来自“生理现象”的工具变量:生老病死;(四)来自“社会空间”的工具变量:距离和价格;(五)来自“实验”的工具变量:自然实验和虚拟实验。通过学习这些经典工具变量分析案例,可以发现,寻找好的工具变量的必要条件是严密的逻辑和辽远的想象力,找工具变量可不是普通人认为是碰巧的事情那样简单。
相关检验必须有,在这个方面,我的体会就是,要做到“人有我有”。
1.最基本的检验。
以下摘录自陈云松(2012)。“要确保工具变量分析结果稳健可信,我们必须首先检验工具变量的合法性,同时还要观察工具变量模型和一般的单方程模型(如OLS或Probit模型)”。从技术难度来讲,为了“追求”良好性质的统计量进而实现有效的统计推断,还应向更复杂、更严格的标准挺进。更为复杂、严格的模型设定检验包括:扰动项球形扰动检验、工具变量与扰动项是否正交的过度识别约束检验,工具变量解释变量是否相关的不可识别检验以及弱工具变量(或称为“弱识别”)检验,模型是否存在内生性的Hausman检验以及冗余性检验等。这些检验在实际操作中还有顺序和步骤,即先做什么后做什么,都是有“讲究的”,具体参见王美金、林建浩、胡毅(2012)。
2.具体示例。
上面讲的都是试图要达到的水平或境界,接下来谈谈如何将这些讲清楚、写清楚。具体的学习进路就是:向优秀致敬,模仿是基础。
例如在“工具变量构造”方面,可以参考叶静怡、武玲蔚(2014)的论文《社会资本与进城务工人员工资水平:资源测量与因果识别》,这篇文章的研究目标是考察“社会资本对进城务工人员工资水平的因果效应”。该文考虑到社会资本的内生性可能导致OLS估计存在偏误,尝试用工具变量法解决这个问题。
作者将根据中国农村的春节拜年习俗构建进城务工人员社会资本的工具变量,构造了两个作为社会资本工具变量的“春节拜年”变量:一个是去年进城务工人员春节拜年的次数的对数,另一个是去年进城务工人员春节是否给他人拜年这一虚拟变量。
第一步:工具变量成立的经济学依据。即要阐释清楚“春节拜年”为什么与社会资本相关,但与进城人员的工资不相关。对此,该文的解释之一是“春节拜年是中国社会尤其是农村最重要的文化传统和习俗之一,对进城务工人员网络的建立、维持和拓展具有积极影响”。该文的解释之二是“在中国农村,春节期间给亲朋好友拜年是传统文化习俗,与宗族网络有密切的关系,对于进城务工人员的工资具有外生性”。
第二步:工具变量相关性检验。“表7展示了社会资本回报率估计的一阶段结果。其中因变量为社会资本,主要自变量是拜年变量”。春节拜年次数对数对声望社会资本和权力社会资本的影响均显著为正。这一组结果表明工具变量的相关性条件能够得到满足。
第三步:弱工具变量问题检验。该文的论证步骤如下:(1)表8的第一阶段回归结果表明,工具变量春节拜年的系数为正且在1%的显著水平上统计显著。(2)根据Staiger and Stock(1997)建议的经验法则,只有一个内生变量时第一阶段回归的F值为10是个经验切割点。表8总结了Weak IV检验的F值结果。我们可以看到,2SLS得到的Cragg-Donald Wald F统计量均大于10(当拜年次数对数和是否拜年分别为工具变量时,声望社会资本和权力社会资本的一阶段F值依次是:20.17、20.52、10.74、11.75)。这一组结果均高于经验切割点(10),可以说冲击上并不存在弱工具变量的风险。(3)我们对工具变量进行了Stock-Yogo的过识别检验(weak identification test),其零假设为模型存在弱识别问题。根据Stock and Yogo(2002)提供的临界值表,2SLS的模型(1)和模型(2)的F统计量均大于20,因此可以拒绝期望最大规模超过10%;而2SLS模型3和模型4的F统计量均大于10,因此可以拒绝期望最大规模超过15%,但不能拒绝其超过10%。综上分析,可以认为,在一般显著水平下弱工具变量的风险非常小。
第四步:Hausman检验。在工具变量有效的情况下,作者对工具变量和普通最小二乘回归进行了Hausman检验。“当使用拜年次数作为工具变量时,无论在声望社会资本还是在权力社会资本的回归中其检验得到的P值均在0.97左右,从而不能拒绝OLS结果与2SLS结果不存在系统性差别的原假设。当使用是否拜年的虚拟变量作为工具变量时,声望社会资本和权力社会资本的回归中其检验得到的P值均高于0.7,同样不能拒绝OLS结果与2SLS结果不存在系统性差别的原假设”。基于Hausman检验结果,作者认为,进城务工人员社会资本这一变量并不存在统计显著的内生性。最后,该文还针对进城务工人员的社会资本可能是外生的观点给予了经验上的解释。作者指出,“我们的样本显示,进城务工人员在京的社会网络中的亲戚、老乡和同学的占其网络规模的近90%。”
运用工具变量来克服内生性问题,必须要考虑到弱工具变量问题。存在一种情形,模型满足秩条件所要求的工具变量与内生解释变量相关程度的最低要求,但是这种相关程度不足以保证统计推断具有良好的性质(王美金、林建浩、胡毅, 2012)。以教育回报率估计为例,在具体估计中,“出生季度”是个弱工具变量,即:人们的出生季度与其受教育年限变异之间,只有微弱的相关性。存在弱工具变量问题时,2SLS估计不仅难以矫正OLS估计的偏差,反因有更大的标准差而有更低的效率,导致“治疗比疾病本身更坏”。
在这个方面,初学者有必要找相关文献来了解一下:如何识别弱工具(Staiger and Stock, 1997;Stockand,Yogo2,2004);弱工具变量条件2SLS估计的偏差及决定因素,如与的相关性(第一阶段的)、结构方程与简约型方程的误差项和的相关性(ρ)、观测值数量(n)、工具变量的书目(K)等(Hahn and Hausman, 2002;2003;Murray,2006);在存在弱工具变量的条件下,如何改进计量方法以获得稳健一致的估计量(Baum etal.,2007;Hansen etal. 2006)。
针对弱工具变量问题方面,至少有两个方面的工作需要掌握:第一、弱工具变量的计量经济学含义(王美金、林建浩、胡毅,2012)。第二、Stock和Yogo(2005)提出的检验思路和方法。
此外,有关具体实例可参见叶静怡、武玲蔚(2014)。 在弱工具变量问题方面,建议大家认真阅读这3篇文献:吴要武(2010)、江艇(2010)、王美金、林建浩、胡毅(2012)。
陈云松(2012)在“四、工具变量估计量的诠释:局部干预效应问题”一节中清晰地阐释了:什么是局部干预效应问题?这个问题为什么如此重要?
以下是对陈云松(2012)相关阐述的摘录。把模型外的变量Z引入模型时,既为模型的识别增加了有效信息,但同时也带来了噪音。其中一个最为重要的问题是:我们并不知道工具变量和解释变量之间相关的具体形式和特征。特别是,工具变量和解释变量之间的相关性,在样本中是均匀还是不均匀分布的呢?如果工具变量对样本人群的影响分布并不均匀,那么工具变量估计量应该更多地反映了部分样本上的因果效应。这就引出了工具变量分析中一个非常重要的解释框架——所谓的“局部平均干预效应”问题(local average treatment effect,简称为LATE,参见Imbens & Angrist,1994;Angrist et al.,1996)。
这个问题之所以重要,是因为社会也好、区域也好、城市也好,人群也好,群体往往具有内在的差异性。这种差异性导致样本对于外生冲击的反应步调并不一致。这样,工具变量估计量在很多情况下只是基于诸多局部样本估计量的加权平均值。理解了这一权重特性,我们就能更好地对工具变量的分析结果进行合理的社会学解释,而不仅仅是提供一堆表格和纯技术的统计量。
如前所述,姜纬教授指出,“局部平均处理效应”(LATE)有可能使工具变量法估计的系数被扩大。在陈云松(2012)的一个研究实例(试图证明农民工收入和同村打工网规模之间存在因果效应)中,IV-Heckit模型给出了一个比Heckit模型更大的网络效应估计值:后者是0.263,而前者达0.628。如何解释IV-Heckit估计值Heckit估计值呢?
就局部干预效应问题而言,陈云松(2012)通过实例展示了,“我们强调工具变量分析不仅仅能对因果推断做出贡献,更能通过对工具变量估计量和一般OLS/Probit估计量进行比较分析,使我们对社会机制及其过程产生深刻的理解和认识。解释和比较分析工具变量结果的过程,就是促使我们深入剖析社会机制的过程”。在这个方面,比较常见的做法就是,将相关检验结果报告一遍,然后说基于工具变量法估计的结果更加准确,其结果值得更加信赖。但这种止步于“工具变量法估计结果更加准确”的做法是远远不够的。积极和有价值的方向是:“在诠释结果时应该尽量对工具变量估计量和OLS或Probit估计量进行比较分析,以探寻偏误的来源和方向,并寻找合理的社会学理论和实际社会现象来解释这些差异”。也就是,要结合相关理论和经验事实来做好这个对比分析。
我们需要好好揣摩一下摩(Morgan,2002)的一个重要观点,那就是:如果把工具变量分析仅仅作为因果推断的工具,未免太狭隘了。
如果说寻找合适的工具变量是实证研究中最为充满智慧和挑战的工作,恐怕并不为过。很多应用计量经济学文献都是因为找到了出人意表又情理之中的工具变量,完美地解决解释变量的内生性问题,而成为各自领域中的经典文献(江艇, 2010)。例如,Angrist和Krueger(1991)用出生季度作为受教育年限的工具变量来估计美国劳动力市场上的教育回报率。
使用工具变量来“缓解”内生性问题,除了通常所做的那些检验工作之外,应将重点集中于弱工具变量问题和局部干预效应问题(前者关注的是影响大小,后者关注的是影响是否均匀),后者有时会更重要一些,因为它关注的是机制,而不仅仅是估计结果的准确性。
我个人对工具变量思路和方法的认识体会就是:第一、尽量要做到人有我有,即别人能做到的,自己也要能考虑到和做到。第二、工具变量从本质上讲,是在接近那个遗失或遗漏掉的重要变量。对此,应从比较的角度来看某个选用的工具变量。第三、使用工具变量法,在其研究者的主观认识中有一个很强的“暗示”,即有一个“唯一”的作用机制的存在,尽量将影响或干扰到这个机制的识别与推断通过的其它可能排除掉。至少我可以说,研究者对其他猜想性的作用机制并未有给予应有或平等性的对待。
想做计量实证研究,内生性问题似乎如影随形,挥之不去。而工具变量呢,给人的感觉就是,众里寻他千百度,那人却在灯火阑珊处。以上权当作是自己整理出来的一个读书计划,有志于学的年轻朋友可以根据我推荐的文献和提供的研修路径努力深究下去。如果要做内生性问题方面的实证研究,建议先认真阅读一下这里所推荐的四篇文献吧。我相信,完整系统地阅读是非常有益的,因为治学最怕遗漏和片面。至少,尽管工具变量的使用看似难以举一反三,但哪怕是前人使用过的失败的工具变量,都有可能具有借鉴和推广意义(陈云松,2012)。最后,比较负责地讲,在一篇考虑内生性问题并使用了工具变量法的论文里,如果不仅交代了工具变量的选择依据及相关检验结果,而且还着重考虑并处理了弱工具变量问题和局部干预效应问题,那么我个人认为,这篇论文也不会差到哪里去。
1、方颖、赵扬:《寻找制度的工具变量:估计产权保护对中国经济增长的贡献》,《经济研究》2011年第5期。
2、黄新飞、舒元、徐裕敏:《制度距离与跨国收入差距》,《经济研究》2013年第9期。
3、陈云松:《互联网使用是否扩大非制度化政治参与:基于CGSS2006的工具变量分析》,《社会》第33卷,2013年第5期。
4、叶静怡、武玲蔚:《社会资本与进城务工人员工资水平——资源测量与因果识别》,《经济学(季刊)》第13卷第4期,2014年7月。
5、Acemoglu,D. Johnson S.and Robinson , J . 2001,“The Colonial Origins of Comparative Development: An Empirical Investigation” , American Economic Review,91,1369-1401.
6、江艇:《对《寻找阿基米德的“杠杆”——“出生季度”是个弱工具变量吗》一文的评论》,载于《中国经济2010》,2010年。
7、吴要武:《寻找阿基米德的“杠杆”——对“出生季度”是个工具变量吗?》,《经济学季刊》第9卷第2期,2010年1月。
8、王美金、林建浩、胡毅:《IV估计框架下模型设定检验问题的讨论》,《统计研究》第29卷第2期,2012年2月。