查看原文
其他

诺奖安神经典作品: 工具变量和识别探究, 从供需到自然实验

计量经济圈 计量经济圈 2022-11-16

凡是搞计量经济的,都关注这个号了
稿件:econometrics666@126.com
所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.
关于诺奖得主Angrist,可参看1.J.Angrist就因果推断长篇评论+音频版,2.Angrist因果推断课程,经典期刊读物汇集,3.经济研究中的自然实验者, Natural Experimenter,4.USA经管商博士最狂热崇拜的计量书籍震撼出炉,5.计量经济学的“公信力革命”, 1983-2010,6.哪本因果推断书籍最好?我们给你整理好了这个书单!7.你应该阅读哪本因果推断书籍: 一份进阶流程图和简短书评列表,8.Sims与安神的论战从未停止,JOE卷入第三次大论战,9.我是安神, 我为因果推断计量代言,10.安神+克拉克奖得主的RDD论文, 断点回归设计,11.政策效应评估的四种方法(Policy evaluation),12.Guido Imbens: 潜在结果和有向无环图在因果推断实证研究中的应用实例讲解(二),13.应用计量经济学现状: 因果推断与政策评估最全综述,14.ECM主编: 潜在结果和有向无环图在因果推断实证研究中的应用权威讲解,15.微观计量经济学在理论和应用上走过的30年,16.微观计量经济学:政策效应评估,17.断点回归设计RDD分类与操作案例,18.广义合成控制法gsynth, Stata运行程序release,19.基于模型还是基于设计的实证方法? 诺奖候选人给你的insights!20.安神最新因果推断大作, 经济学中的实证策略: 阐明从因果关系的路径!21.三重差分法运行和示例, 附上运行代码和结果解析!22.拐点回归设计RKD概览, 及其开展实证研究的经典示例,23.诺奖得主Angrist的因果推断课程文献读物单子再次更新了, 还提供了其他三门课程

正文

工具变量和识别探究:从供需到自然实验

关于下方文字内容,作者:许婉莹, 中南财经政法大学财政税务学院,通信邮箱:1226278950@qq.com

作者之前的文章:1.再中心化影响函数RIF回归和分解的Stata操作程序,2.顶刊中的再中心化影响函数(RIFs): RIF回归和RIF分解全解析, 附code, 数据和示例

Angrist, Joshua, D., and Alan B. Krueger. 2001. "Instrumental Variables and the Search for Identification: From Supply and Demand to Natural Experiments." Journal of Economic Perspectives, 15 (4): 69-85.

Instrumental variables was first used in the 1920s to estimate supply and demand elasticities and later to correct for measurement error in single equation models. Recently, instrumental variables have been widely used to reduce bias from omitted variables in estimates of causal relationships. Intuitively, instrumental variables methods use only a portion of the variability in key variables to estimate the relationships of interest; if the instruments are valid, that portion is unrelated to the omitted variables. We discuss the mechanics of instrumental variables and the qualities that make for a good instrument, devoting particular attention to instruments derived from "natural experiments."

目录

工具变量法是计量经济学工具中的标志性技术。工具变量的典型例子和最早的应用包括用于估计需求和供给曲线。经济学家如P.G. Wright、Henry Schultz、Elmer Working和Ragnar Frisch对估计从括鲱鱼到黄油等一系列产品的需求和供给弹性感兴趣,并通常使用时间序列数据。如果需求和供给曲线随时间移动,则观察到的数量和价格数据反映了两条曲线上的一组平衡点。因此,数量对价格用普通最小二乘回归无法识别——即描绘——供求关系。
P.G. Wright(1928)在工具变量的开创性应用中遇到了这个问题:估计亚麻籽的供求弹性,也即亚麻油的来源。Wright指出,仅从价格和数量之间的关系很难获得供求弹性的估计。然而,他建议(第312页),某些“曲线转换器”-我们现在称之为工具变量-可以用来解决这个问题:“这些额外的因素可能(A)影响需求条件而不影响成本条件,或(B)影响成本条件而不影响需求条件。”用于需求曲线转换的变量是替代品价格,如棉籽,而用于供给曲线转换的变量是每英亩产量,这可以被认为主要由天气来决定。
具体来说,需求弹性的工具变量估计可以通过将亚麻籽对数数量和每英亩产量之间的样本协方差除以亚麻籽对数价格和每英亩产量之间的样本协方差来构建。只要每英亩产量与需求方程中的误差不相关,而与价格相关,这个估计就是一致的。在这个计算中,用替代品的价格代替每英亩的产量,从而产生了对供给弹性的工具变量估计。直观地说,与天气有关的产量转化器被用来描绘需求曲线,而替代品价格的变化被用来转化需求曲线,从而描绘出供给曲线。
Wright (1928年,第314页)观察到:“这种方法的成功取决于发现A类和B类因素的成功。”他使用六种不同的供应转换器来估计需求曲线,然后对六个工具变量的估计值取平均。由此得出的亚麻籽平均需求弹性是——0.80。他对工具变量估计值取平均,发现供给弹性的平均为2.4。莱特在计量经济学方面的进展没有被后来的文献所注意。直到20世纪40年代,工具变量和相关方法才被重新发现和扩展。
Wright(1928)对不同工具变量估计取均值的方法不一定会产生最有效的估计;其他估计量可以将不同工具中的信息结合起来,产生一个样本变异性更小的估计值。组合多种工具变量的最有效方法通常是两阶段最小二乘法,最初由Theil (1953年)开发。在第一阶段,用“内生”自变量(本例中为价格)对所有工具变量进行回归。在第二阶段,基于工具变量的数据和从第一阶段回归估计的系数得到价格预测值,然后将其直接插入到感兴趣的方程中,代替内生自变量,或者等价地,被用作内生自变量的工具变量。这样,两阶段最小二乘法将一组工具变量中的信息巧妙地归结为单个工具变量。

工具变量和测量误差

工具变量方法也被用来克服解释变量中的测量误差问题。测量误差的产生可能有多种原因,包括统计机构收集准确信息的能力有限,以及经济理论中要求的变量与实际收集的变量之间的偏差。如果某个解释变量是用可加的随机误差衡量的,则在大样本下的二元普通最小二乘回归中该变量的系数将偏向于零。误差越高引起的变异比例越大,偏差越大。如果工具变量与测量误差和方程误差(即,具有正确测量数据的模型的方程误差)不相关,但与正确测量的变量相关,则即使存在测量误差,工具变量也能提供一致的估计。
弗里德曼(1957)经典的消费函数分析可以解释为工具变量在这种情况下的应用。年收入是对永久收入的一种噪声衡量,因此,对年收入的消费回归所产生的的结果对于永久收入的边际消费倾向的估计而言太小。为了克服这个测量问题,弗里德曼将他的数据按城市分组,这相当于使用两阶段最小二乘法。第一个阶段是年收入对一组城市虚拟变量进行回归。此回归的拟合值将是各城市的平均收入,因此,对拟合收入值的微观消费数据进行回归。正如两阶段最小二乘法中所做的,与使用城市平均数据的加权回归相同,其中权重是每个城市的观察次数。
虽然两阶段最小二乘法和其他工具变量估计是一致的,但它们不是无偏的。工具变量估计不是无偏的是因为它们涉及随机量的比率,且这些随机量的期望值需要即不存在也无相应的简单形式。相反,普通最小二乘估计值的期望值通常存在,并且易于计算。教科书有时掩盖了无偏性和一致性之间的区别,但这种区别在实践中可能很重要。无偏性意味着在任何大小样本中,估计量具有以的感兴趣参数为中心的抽样分布,而一致性仅意味着估计量随着样本大小的增加而收敛到总体参数。由于工具变量的估计是一致的,但不是无偏的,使用工具变量的研究人员应该致力于大样本的研究。
工具变量估计量渐近分布的精确形式(即,极大样本中的抽样分布)取决于许多技术条件。大多数现代软件包包括了在合理的一般假设下渐近有效的“稳健标准误”选项。然而,重要的是要记住,在实践中,这些标准误只是近似值。

工具变量和遗漏变量

虽然工具变量方法仍然被广泛用于估计联立方程系统和抵消测量误差的偏差,但是最近的大量工作通过使用工具变量来克服因果关系估计中的遗漏变量问题。这类研究主要涉及估计狭义的因果关系,如学校教育、培训或服兵役对收入的影响;吸烟或药物治疗对健康的影响;社会保险计划对劳动力供给的影响;或者治安对犯罪的影响。在这些例子和许多其他例子中观察到的结果和感兴趣的解释变量之间的关联很可能是误导性的,因为它部分反映了与这两个变量相关的遗漏变量。如果这些因素可以被测量并在回归中保持不变,遗漏变量偏差将被消除。然而,在实践中,经济理论通常不会指定在估计关系时应该保持不变的所有变量,并且即使指定了相关变量,也很难准确地测量所有的相关变量。
解决遗漏变量问题的一个方法是随机分配感兴趣的变量。例如,社会实验有时会将人们分配到一个工作培训项目或一个控制组。随机分配确保参与计划(在分配池中)与遗漏的个人或社会因素无关。然而,随机实验并不总是可行的。强迫随机选择的一群人戒烟或多上一年学,或者在各州之间随机分配最低工资的数值是不可行的。另一方面,也许有可能找到,甚至创造出,像学校教育、吸烟和最低工资等变量的某种程度的外生变异。工具变量在这些情况下提供了一个潜在的解决方案。
为了了解工具变量如何解决遗漏变量问题,假设我们想使用以下横截面回归方程来衡量“学校教育回报率”,表示为:

在该方程中,Yi是个体i的工资对数,Si是是个体完成的最高学历,而Ai用于衡量能力或激励。(为简化,我们认为Ai是单个变量,尽管它也可以是变量的向量。)虽然估计这个等式的问题在原理上是简单明了的,但是关于Ai的数据通常是不可得的,并且研究人员不能确定在任意情况下对能力或激励的正确控制变量是什么。在没有其他信息的情况下,感兴趣的参数是没有被识别的;也就是说,我们不能仅仅从收入和学校教育的联合分布中推断出它。
然而,假设我们有第三个变量,工具变量表示为Zi,它与学校教育相关,但与收入无关。也就是说,Zi与遗漏变量和回归误差εi不相关。那么,学校教育收益的工具变量估计就是Cov(Yi, Zi)/Cov(Si, Zi)的样本模拟。工具变量方法使我们能够一致地估计感兴趣的系数,并且不受遗漏变量的渐近偏差的影响,而实际上没有关于遗漏变量的数据,甚至不知道它们是什么。如果有效工具变量不止一个,可以用两阶段最小二乘法估计感兴趣的系数。直观地说,工具变量通过仅使用学校教育中的部分可变性——具体地说,是与遗漏变量不相关的部分——来估计学校教育和收入之间的关系,从而解决了遗漏变量问题。
用来克服遗漏变量偏差的工具变量有时被认为是来自“自然实验”的。近年来,以这种方式使用工具变量的现象再次出现——也就是说,利用自然力量或政府政策共同创造出一种类似于随机实验的环境。这种类型的应用产生了经济学中一些最具争议的实证发现,以及一些关于实质和方法的争议。
一个好的工具变量与内生自变量相关,且其原因研究者可以验证和解释,但与结果变量无关。Maddala (1977年,第154页)问道,“你从哪里找到了这样一个变量?”像大多数计量经济学教科书一样,他没有给出答案。在我们看来,好的工具变量往往来自于对决定感兴趣的回归变量的经济机制和制度的详细了解。
就学校教育而言,人力资本理论认为,人们通过比较各种选择的成本和收益来做出学校教育的选择。因此,工具变量的一个可能来源是成本差异,比如贷款政策或其他补贴,这些成本差异与能力或收入潜力无关。教育程度差异的第二个来源是制度约束。Angrist和Krueger (1991)在一篇论文中利用了这种差异,该论文典型地使用“自然实验”来试图消除遗漏变量偏差。
Angrist和Krueger (1991年)方法的基本原理是,因为大多数州要求学生在年满6周岁的年份入学,所以入学年龄是出生日期的函数。那些在一年中晚些时候出生的人对于他们的年级来说是年轻的。在以生日是12月31日为截止日期的州,第四季度出生的儿童入学年龄为53/4岁,而第一季度出生的儿童入学年龄为63/4岁。此外,由于义务教育法通常要求学生在16周岁之前留在学校,这些学生群体在达到法定离校年龄时将处于不同的年级。从本质上说,入学年龄政策和义务教育法律的结合创造了一个自然的实验,在这个实验中,孩子们被迫根据他们的生日有不同的上学时长。
利用1980年人口普查的数据,我们研究了1930年至1959年出生的男性的教育程度和出生时间之间的关系。总的情况是年轻的出生队列完成了更多的学校教育。图1显示了20世纪30年代出生的男性受教育程度和出生时间的关系。该数字清楚地表明,在日历年早些时候出生的男子平均受教育水平往往较低。我们选择了这个十年的出生队列,因为这个年龄的男性倾向有一个相对平坦的年龄—收入曲线。但是出生在年初的男性受教育程度较低的模式同样适用于20世纪40年代和50年代出生的男性。因为一个人的出生日期可能与这个人的先天能力、动机或家庭关系无关(排除占星术的影响),所以出生日期为学校教育提供了一个有效的工具变量。

图2显示了同一样本按出生季度划分的平均收入。本质上,该图显示了工具变量和因变量之间的“简化式”关系。年龄较大的群体往往收入较高,因为收入随着工作经验的增加而增加。但该图表还显示,平均而言,一年中早些时候出生的男性收入几乎总是低于晚些时候出生的男性。重要的是,这种简化式关系与学校教育中的出生季度模式相似。对简化式和第一阶段估计的检查,无论是以图形还是表格的形式,经常提供关于激发一组特定工具变量估计的因果故事的见解。在这种情况下,很明显,与出生季度相关的教育和收入差异是离散信号,而不是与老龄化逐渐影响相关的平滑变化。

在这种情况下,工具变量背后的直觉是,不同出生季度的收入差异被认为仅由出生季度下的教育时长差异来解释,因此学校教育的估计回报只是对出生季度带来的平均收入差异的一定的重新调整。只有一小部分学校教育的差异性——与出生季度相关的部分——被用来确定教育回报。在我们的正式统计性估计中,我们发现第一季度出生的男性比之后季度出生的男性受教育时间少十分之一年,并且也比之后季度出生的男性收入低0.1%。收入差异与受教育差异的比率约为0.10,是对额外教育年限的比例收入增长的工具变量估计。
事实证明,这种对额外教育引起的收入变化的估计,与我们数据中教育对收入的简单普通最小二乘回归没有什么不同。这一发现表明,在教育对收入影响的普通最小二乘估计中,遗漏的能力变量几乎没有偏差,这可能是因为收入方程中的遗漏变量与教育弱相关或不相关。在其他应用中,工具变量估计和普通最小二乘估计有很大不同。例如,Angrist和Lavy (1999年)使用从迈蒙尼德规则构建的工具估计班级规模对学生成绩的影响,这是一种班级规模的官僚上限,导致以色列学校平均班级规模的巨大差异。在这种情况下,普通的最小二乘估计显示出较大类别的无影响或有益影响,而相应的工具变量估计显示出较小类别的统计显著和相当大的有益影响。
对工具变量的自然实验方法的一个常见批评是,它没有完全阐明潜在的理论关系(例如,Rosenzweig和Wolpin,2000)。例如,在Angrist和Krueger (1991年)的应用中,教育和收入之间的理论关系不是从一个完善的理论模型发展而来的;而是取决于教育系统的制度细节。不过,我们很容易被激发教育对收入因果影响的兴趣。此外,工具变量的自然实验方法在根本上是以理论为基础的,在这个意义上,通常有一个完善的故事或模型来推动工具变量的选择。这些故事的含义可以用来支持或反驳对使用工具变量估计的行为阐述。
例如,对图1和图2中的模式的解释是由入学年龄政策和义务教育的相互作用造成的,这一解释得到了我们的发现的支持,即对于拥有大学或更高学位的人来说,出生季度与收入和教育程度无关。这个群体不受义务教育法的约束,因此,如果在这个样本中,出生季度与教育或收入有关,那么使用出生季度作为工具变量的理由就会被反驳。该测试没有否定识别策略的发现表明,除了义务教育之外,其他因素对全样本中教育和工具变量之间的相关性没有影响。
基于自然实验来分析工具变量的丰富含义和潜在的可反驳性是使这种方法具有吸引力的重要原因。事实上,选择工具变量最机械、天真和普通的方法之一是利用非理论且难以评估的动态关系的假设,并从时间序列或面板数据中的滞后变量构建工具变量。如果方程误差或遗漏变量是相关的,那么将滞后内生变量作为工具变量是有问题的。在这方面,Wright(1928)使用了更合理的外生工具变量“每英亩产量”,该方法似乎领先于这个研究时期。

用异质响应来解释估计

解释工具变量估计的一个难点在于,并非每个观察的行为都受到工具变量的影响。正如我们所强调的,工具变量方法可以被认为是通过只使用解释变量的部分变化来操作的,也就是说,只改变一些人的行为。例如,在刚刚讨论的Angrist和Krueger(1991)的研究中,出生季度的工具变量与那些极可能即将离校的人相关,但对那些可能即将上大学的孩子几乎没有影响。
另一个说明这一点的例子是Angrist(1990年)使用越战时期的征兵抽签号码作为一种工具变量来估计服役对之后收入的影响。20世纪70年代初随机分配给年轻男子的征兵抽签号码与被征召入伍的可能性高度相关,但与其他可能改变收入的因素无关。军事草案可能会影响那些本来不会参军的人的行为。但大多数在越南服役的人都是真正的志愿者,无论他们的号码多少,他们都会服役。因此,使用抽签号码作为工具变量的估计仅限于对有征被兵经历者的影响。这可能不包括服兵役对志愿者的收入影响。
换句话说,工具变量为特定群体提供了估计,即其行为可以被工具变量操控的那些人。Angrist和Krueger(1991年)使用的出生季度工具变量对那些受教育程度因该工具变量而改变的人进行了估算。类似地,征兵抽签的工具变量为处理组的一个子集(即相关行为被抽签“实验”改变的男性)提供了定义清晰的因果关系估计。
这一问题出现在许多使用工具变量的研究中,并在Imbens和Angrist(1994)的论文和相关工作中进行了正式讨论。他们表明,在虚拟内生变量的情况下,工具变量方法估计了那些在随机试验中相关行为将被工具变量改变的群体的因果效应。也就是说,如果将受试者被分配到处理组,则对接受处理的受试者进行效果评估,不接受处理的不估计。该参数称为局部平均值,或者简称LATE。在某些情况下,由LATE识别的“依从者compliers”(是否参加培训的选择依从随机分组的结果,当分配到实验组时会选择“参加培训”,当分配到对照组时会选择“不参加培训”。)组的经验代表了整个处理组。如果群体中的每个个体对特定干预或处理都有相同的反应,如通常假设的那样,那么LATE和其他参数之间的区别并不重要。但对于“异质性处理效应”,由工具变量识别的参数可能不同于感兴趣的平均效应。
应该注意的是,这种估计的特殊性是经验研究特有的。所有的统计方法,从最简单的回归到最复杂的结构模型,在用于分析具有不同反应的现象时都有这种局限性。然而,许多干预和关系可以通过利用特定子样本的估计效应得出不错的研究结果,但其前提在于,得到结论的潜在限制能被理解和探究。事实上,缺乏直接的普遍性可能是临床试验的医学研究的常态,但在这一领域也已经取得了很大进展。
我们的观点是,工具变量方法通常可以解决定义清晰的样本下遗漏变量的一阶问题。由于许多实证研究中的样本量和可变性范围非常有限,因此外延到其他群体自然带有一定的推测性,通常严重依赖于理论和常识。(一种有助于玉米在爱荷华州生长的肥料可能也会对加州的愚昧玉米产生有益的影响,但是人们不能确定。)此外,异质处理效应的存在是分析更多而不是更少的自然实验的原因,并以理解感兴趣效应中异质性的来源和程度。
同样值得强调的是,人们往往出于内在感兴趣去了解自然实验中的群体。例如,Angrist和Krueger (1991年)的工具变量估计,是根据义务教育法下群体在学校教育方面的差异确定的,(具体而言)是与防止孩子们高中辍学政策的法律和体制变化所导致的学校教育增加的经济回报评估有关。在征兵抽签的例子中,即使工具变量的估计不一定能同时告诉我们军队经历对志愿者和应征者收入的影响,但了解征兵对今后平民收入的影响也是很重要的。此外,工具变量分析背后的故事通常开辟了其他的研究途径。例如,Angrist (1990)将与越战时期服役相关的平民收入惩罚解释为由于劳动力市场经验的损失。如果是真的,由此产生的估计对其他时间和地点的义务兵役的后果具有预测效力。

潜在问题

工具变量会出什么问题?最重要的潜在问题是坏的工具变量,即与遗漏变量(或联立方程情况下感兴趣的结构方程中的误差项)相关的工具变量。尤其令人担忧的是,工具变量和遗漏变量之间的相关性可能会导致结果估计的偏误,且该偏误比普通最小二乘估计的偏误大得多。此外,在进一步探究中,看似合适的工具变量也可能与遗漏变量相关。例如,巴西的天气可能会改变咖啡的供应曲线,这为估计价格对需求量的影响提供了一个可信的工具变量。但巴西的天气也可能改变咖啡的需求,如果精明的买家在纽约咖啡、糖和古柯交易所(即咖啡期货交易所)利用天气数据来调整库存,那么预计价格上涨可能不会成为现实。
另一个问题是,当工具变量与内生回归变量的弱相关时,可能会出现偏误。这种可能性首先被Nagar (1959)注意到,并被Bound、Jaeger和Baker (1995)强调。事实上,使用弱工具变量进行工具变量估计往往集中在相应的普通最小二乘估计上(Sawa,1969)。
弱工具变量问题的目前已经有几种解决方案。首先,两阶段最小二乘法的偏误与过度识别的程度成正比。换句话说,如果用K个工具变量来估计G个内生变量的效应,偏误与K-G成正比。因此,使用更少的工具变量可以减少偏误。事实上,如果工具变量的数量等于内生变量的数量,偏误大约为零。而对于弱工具变量问题,目前也提出了各种技术修复和诊断测试。
对弱工具变量问题的担忧可以通过探究简化式方程来减轻,即用感兴趣的因变量对工具变量和外生变量做普通最小二乘回归。这些估计是无偏的,即使是弱工具变量。因为简化式效应与感兴趣的系数成比例,所以可以确定感兴趣的系数的符号,并通过重新调整简化形式的影响来猜测其大小使用关于第一阶段系数大小的合理假设形成。最重要的是,如果简化式的估计值与零没有显著差异,则应该假设感兴趣的影响不存在或者工具变量太弱而无法检测到它。同时还应考虑简化形式效应大小的合理性。
通过讨论两阶段最小二乘估计中的第一和第二阶段中的函数形式问题,从而得出有关陷阱的结论。研究人员有时会尝试通过虚拟的内生回归因子并使用probit或logit方法,在应用中生成第一阶段预测值。但这是不必要的这甚至可能造成一些伤害。在两阶段最小二乘法中,第二阶段的一致性估计并不取决于获得正确设定的第一阶段函数形式(Kelejian,1971)。因此,即使使用虚拟内生变量,第一阶段线性回归估计会产生一致的第二阶段估计。此外,将非线性第一阶段估计生成拟合值,直接插入第二阶段方程并不会产生一致估计,除非非线性模型恰好设定正确的,但这极可能导致发生错误识别的危险。
连续或多值回归的非线性第二阶段估计也同样棘手,且需要一个正确设定的函数形式以便于对估计量进行解释。即使潜在的第二阶段关系是非线性的,使用线性工具变量估计,如二阶段最小二乘法也通常能展现出经济利益的平均效应,且类似于虚拟内生自变量的LATE参数 (Angrist和Imbens,1995;Card,1995年;Heckman和Vytlacil,1998年)。因此,两阶段最小二乘法是一种稳健的估计方法,为工具变量应用提供了一个自然的起点。函数形式问题的重要性可以在更详细的二次分析中通过试验替代工具变量和检查合适的图表来评估。

大自然的实验流

Trygve Haavelmo (1944,第14页)在两种实验之间做了一个类比:“那些我们想要做的”和“大自然正在从自己的巨大实验室中不断地进行实验,我们只是作为被动的观察者来观察。”他还哀叹道,“不幸的是,大多数经济学家不会明确描述他们的实验设计。”近期许多工具变量在遗漏变量问题上的应用展现了其致力于描述和评估潜在的准实验设计的特征。这可以被看作是一种明确的尝试,即利用观察数据尽可能地模拟随机实验。
一些经济学家对找到大量有用的自然实验的前景持悲观态度。例如,Michael Hurd (1990年)称,寻找自然实验来测试社会保障对劳动力供给的影响“过于谨慎”,并警告说,“如果该方法应用于其他领域的实证工作,将造成估计终止。”我们并不认为自然实验是获得有用结果的唯一途径,只是认为它们有可能大大增加我们对重要经济关系的理解。表1提供了一些近期研究的例子,包括用工具变量方法来分析自然实验或研究者设计的随机实验。但我们很难去说实证研究已经停止。

表1中的第一个面板说明了自然实验思想在最近的实证工作中的应用范围。其他例子可以在Meyer (1995年)和Rosenzweig和Wolpin (2000年)的调查中找到。其中一些例子比另一些更有说服力。但是所有的区别都在于尝试去证实用来推断因果关系的潜在假设。比起许多表面上的结构模型,这些尝试背后有更多的“理论”支撑,因为在这些模型中包含或排除某些变量的理由既没有明确描述也没有进行评估。
表1中的第二个面板说明了另一个重要的发展:随机实验中工具变量的使用。出于实践或伦理考虑,当处理组或对照组存在不完全依从性时,工具变量在实验中是有用的。例如,在随机评估训练计划中,一些处理组成员可能拒绝训练,而一些对照组成员可能通过实验外的渠道进行训练。类似地,在医学试验中,医生可能愿意随机而非强制地去提供改变行为(如吸烟或服用新药)的激励措施。
即使在存在依从性问题的实验中,工具变量也可以用来估计干预措施的效果,如职业培训或药物治疗。在这种情况下,工具变量是虚拟变量,表示随机分配到处理组或对照组,具有内生性的自变量是处于实际处理状态的指标。例如,在训练评估中,实际处理状态变量是虚拟变量,对于每个参加训练的处理和对照组成员来说等于1,而对于所有没有参加训练的人来说等于0。这种方法对符合随机分配的处理群体(即分配依从者)的因果效应可以产生一致估计(Imbens and Angrist,1994)。就像在自然实验中一样,工具变量被用来作为一种外生性的变动——且由该例中的随机分配创造——并用于估计感兴趣的效应。这种研究者创造的工具的使用越来越多,反映了经典实验和观察研究方法的加速融合。

我们的观点是,工具变量方法的应用进展在很大程度上取决于寻找或创造可信实验的艰苦工作,这些实验用于测量重要的经济关系——统计学家David Freedman (1991)称之为“实地”研究。这里的主要挑战并不是需要新理论或者估计量的技术。相反,相关改善是来自于详细的机制内容以及对特定环境中起作用的力量的仔细调查和量化。当然,这样的努力并不新鲜。它们一直是好的实证研究的核心。

长按以上二维码即可下载原文PDF

关于因果推断,可参看关于各种因果识别方法的120份经典实证文献汇总”,哈佛大学新修订完成的因果推断经典大作免费下载!附数据和code,因果推断的统计方法总结, 177份文献政策评估的计量方法综述, 包括最新因果推断方法在教育领域使用IV, RDD, DID, PSM多吗? 使用具体文献,看完顶级期刊文章后, 整理了内生性处理小册子工具变量精辟解释, 保证你一辈子都忘不了DID, 合成控制, 匹配, RDD四种方法比较, 适用范围和特征关于双重差分法DID的32篇精选Articles专辑!关于(模糊)断点回归设计的100篇精选Articles专辑!匹配方法(matching)操作指南, 值得收藏的16篇文章等,MIT广为流传的政策"处理效应"读本DID的研究动态和政策评估中应用的文献综述最新政策效应评估的四种方法政策效应评估的基本问题等。
1.用"因果关系图"来进行因果推断的新技能2.因果推断专题:因果图3.因果推断专题:有向无环图DAG4.confounder与collider啥区别? 混淆 vs 对撞5.三张图秒懂, 混淆, 中介, 调节, 对撞, 暴露, 结果和协变量的复杂关系6.中介效应检验流程, 示意图公布, 不再畏惧中介分析7.图灵奖得主Pearl的因果推断新科学,Book of Why?  8.前沿: nature刊掀起DAG热, 不掌握就遭淘汰无疑!因果关系研究的图形工具!9.前沿: 卫星数据在实证研究中的应用, 用其开展因果推断的好处!10.7大因果推断大法精选实证论文, 可用于中国本土博士课堂教学!11.随机分配是什么, 为什么重要, 对因果关系影响几何?12.应用计量经济学现状: 因果推断与政策评估最全综述13.疫情期计量课程免费开放!面板数据, 因果推断, 时间序列分析与Stata应用14.Python做因果推断的方法示例, 解读与code15.内生转换模型vs内生处理模型vs样本选择模型vs工具变量2SLS16.不用IV, 基于异方差识别方法解决内生性, 赐一篇文献等等。

关于因果推断书籍:哈佛大学新修订完成的因果推断经典大作免费下载!附数据和code!图灵奖得主Pearl的因果推断新科学, Why?计量课程免费开放!面板数据, 因果推断, 时间序列分析与Stata应用(慕课上有不少免费课程,建议年轻学者好好使用),④你应该阅读哪本因果推断书籍: 一份进阶流程图和简短书评列表
下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

2.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存