查看原文
其他

基本无害 | 管用的工具变量——工具变量和因果关系

基本无害的 数据Seminar 2022-12-31

基本无害的计量经济学

——实证研究者指南

(重译本)

李井奎 译



第四章 管用的工具变量:有时你就是可以得你所需

第一节 工具变量和因果关系



正文共5116个字,预计阅读时间13分钟。感谢阅读!

原文:4.1

温馨提示:左右滑动可查看完整公式!



第四章   管用的工具变量:有时你就是可以得你所需

该发生的,总会发生。
该在发生时引起其他事情发生的,总会在发生时引起其他事情发生。
该在发生时引起本身再次发生的,总会再次发生。
然而,时间上不必总是遵循前后顺序。
——道格拉斯·亚当斯  《基本无害》
有两件事将计量经济学与统计学这一“姊妹”领域区分开来。一是计量经济学对因果关系毫不讳言。因果推断一直是应用计量经济学中这场游戏的名称。统计学家Paul Holland(1986)提醒说,“没有操纵就没有因果关系(no causation without manipulation)”,这一格言似乎排除了从非实验数据进行因果推断的可能性。浅尝辄止的观察人士则满口是“相关关系不等于因果关系”这一老生常谈。与大多数以数据为生的人一样,我们相信相关性有时可以为因果关系提供很好的证据,即使研究人员或实验者没有操纵相关变量。[1]我们区别于大多数统计学家——实际上也区别于大多数其他社会科学家——的第二点是我们拥有的统计工具库,这些工具来自于对如何估计线性联立方程组中的参数问题的早期计量经济学研究。其中最有力的武器,莫过于工具变量法(IV),这也是本章的主题。事实证明,IV方法不仅能让我们一致地估计联立方程组中的参数,还可以让我们做到更多。在20世纪20年代研究农业市场时,菲利普·赖特(Phillip Wright)和休厄尔·赖特(Sewall Wright)这对父子研究团队对这样一个具有挑战性的因果推断问题很感兴趣:当观察到的价格和数量数据由供需两条曲线的交点决定时,如何估计供给和需求曲线的斜率。换句话说,均衡价格和数量——这是我们唯一能观察到的——同时求解两个随机方程(而得)。那么,观察到的价格和数量的散点图位于哪条曲线上呢?在一组联立方程中,总体回归系数估不出任何一个方程的斜率这一事实,菲利普·赖特(Phillip Wright)已经有所了解。在赖特(1928)中首次提出的IV方法,通过使用出现在一个方程中的变量来移动这个方程并追踪另一个方程,求解了这些统计联立方程问题。产生这种变化的变量被称为工具变量(Reiersol, 1941)。在另一个独立的研究中,IV方法被首创来解决回归模型中测量误差的偏差问题。[2]线性模型的统计理论中最重要的结果之一是,当感兴趣的回归变量用随机误差测量时,回归系数会偏向于零(要想知道为什么,可以想象回归变量只包含随机误差;那么它与因变量不相关,因此 对该变量的回归将为零)。工具变量方法可以用来消除这种偏差。联立方程模型(SEMs)在计量经济思想史上有着极其重要的地位。但同时,今天最有影响力的应用论文很少依赖于正统的SEM框架,尽管用于讨论IV方法的术语仍然来自这个框架。今天,我们更可能发现IV方法用于解决测量误差问题,而不是用于估计SEM的参数。然而,毫无疑问,当代IV方法最重要的应用是解决遗漏变量偏差(OVB)的问题。IV方法解决了控制变量缺失或未知的问题,就像随机试验消除了回归中的超量控制变量一样。[3]

4.1  工具变量和因果关系

我们喜欢以两步迭代方式讲述IV的故事,首先是在一个不变效应的受限模型中讲述,然后是在一个不受限制的异质潜在结果的框架中讲述,在这种情况下,因果效应也必须是异质的。在不改变我们在实践中最有可能使用的核心统计方法(通常是两阶段最小二乘或2SLS)的机制的情况下,异质性效应的引入丰富了对IV估计的解释。先对不变效应加以关注,可以使我们能够以最小的混乱解释IV的机制。我们给出一个不变效应架构,作为学校教育和工资之间因果关系的框架,假设如前文3.2节中讨论回归和因果性时一样,我们可以写出潜在结果:
以及:
同样地,就像在之前的讨论中,我们假设存在一个控制变量向量 ,即所谓的“能力”,它能够提供一个基于可观测变量选择的表示:
其中 仍是总体回归系数的一个向量,因此 根据构造是不相关的。目前假设,变量 相关的唯一原因,所以:
换句话说,如果 可以被观测到,那么我们将乐于把它纳入到工资对学校教育的回归中;因此产生了一个下面这样的长回归:
等式(4.1.2)是线性因果模型(3.2.9)的一个变体。这个方程中的误差项是对 进行控制后剩下的潜在结果 的随机部分。根据假设这个误差项与学校教育无关。如果这个假设被证明是正确的,那么 的总体回归就产生了(4.1.2)的系数。我们最初想解决的问题是,当 不能被观测到时,如何估计长回归系数 。工具变量方法可以用于实现这一点,当研究者可以得到一个变量(即“工具”,我们将其记为 ),该变量与感兴趣的因果变量 相关,但与因变量的任何其他决定因素不相关。这里,所谓“与因变量的任何其他决定因素不相关”,就是在说 ,或者也可以这样说, 都不相关。这种说法被称为排他性约束(exclusion restriction),因为 可以说成是被排除在感兴趣的因果模型之外的。

给定排他性约束,由(4.1.2)可得:

(4.1.3)中的第二个等式是很有用的,因为它通常更容易用回归系数而不是用协方差来思考。相关系数 上的总体回归(称为简化形式(reduced form))与 上的总体回归(称为第一阶段)之比。IV估计量是表达式(4.1.3)的样本对应物。注意,IV估计量基于的是第一阶段不为零的概念,而这是可以通过检查数据得出来的。一般来说,如果第一阶段与零值仅略有显著差异,那么所得到的IV估计就不太可能提供信息,这一点我们稍后再讨论。为了使(4.1.3)中的协方差之比等于因果效应 ,有必要重述一下这些假设。首先,工具变量必须对 有明显的影响。这是第一阶段。第二, 之间存在关系的唯一原因源自第一阶段。目前,我们称这第二个假设为排他性约束,不过我们将在讨论具有异质效应的模型时会看到,这个假设实际上有两个部分:第一个部分是,工具变量是随机分配的(即以协变量为条件而独立于潜在结果,如第3章的CIA条件),第二个部分是,除非通过第一阶段的渠道,工具变量对结果没有影响。那么,在哪里可以找到一个工具变量呢?好的工具变量来自于在确定感兴趣变量的过程中对制度知识和思想的结合。例如,教育的经济模型表明,接受学校教育的决定是基于替代性选择的成本和收益做出的。因此,接受学校教育的工具变量的一个可能来源,是由于贷款政策或其他补贴造成的费用差异,这些差异与能力或收入潜力无关。学校教育接受差异的第二个来源是制度约束。义务教育法是一套与学校教育相关的制度约束。Angrist和Krueger(1991)在一篇论文中即利用义务教育引起的变化,有代表性地使用“自然实验”来消除OVB。Angrist和Krueger(1991)的出生季度识别策略的出发点,是观察到大多数州要求学生在他们满6岁的公历年入学。因此,入学年龄是出生日期的函数。具体来说,年尾出生的孩子在他们的年级里比较小。在12月31日为生日截止日期的州,第四季度出生的孩子在6岁之前一段时间就已入学,而第一季度出生的孩子在6岁半左右才入学。此外,由于义务教育法通常要求学生必须在学校待到16岁生日,所以当这些学生群体达到法定的辍学年龄时,他们将会处于不同的年级,或在同一年级但上的时间长短不同。学校的入学年龄政策和义务教育法的结合创造了一个自然的实验,在这个实验中,孩子们被迫根据他们的生日去接受不同时间的学校教育。Angrist和Krueger利用美国人口普查数据研究了受教育程度和出生季度之间的关系。图4.1.1的A(改编自Angrist和Krueger(1991))显示了1980年人口普查中出生在20世纪30年代的男性不同出生季度下的受教育情况。这一数据清楚地表明,在公历年中出生较早的男性,其平均教育水平往往较低。图4.1.1中的A是第一阶段的图形描述。一般IV框架中的第一阶段是因果关系变量对协变量和工具变量的回归。这张图总结了这一回归,因为按出生年份和出生季度计算的平均受教育程度是对出生年份虚拟变量(协变量)和出生季度虚拟变量(工具变量)进行受教育程度回归后得到的拟合值。图4.1.1中的B显示了用于构造A图的相同样本按出生季度给出的平均收入。图B说明了工具变量和因变量之间简化形式下的关系。简化形式是因变量对模型中的协变量和工具变量的回归。图B显示,年长组往往收入更高,因为收入会随着工作经验的增加而增加。该数据还表明,出生在较早季度的男性平均收入几乎总是低于出生在较晚季度的男性,即使在调整出生年份(Angrist和Krueger(1991)架构中的协变量)后也是如此。重要的是,这种简化形式的关系与学校教育中出生季度的模式相似,表明这两种模式密切相关。因为一个人的出生日期很可能与他或她的先天能力、动机或家庭关系无关,所以似乎可以可信地断言,收入上下波动的唯一原因是受教育程度的上下波动。这是出生季度这一IV故事的关键假设。[4]

图4.1.1:第一阶段的图形描述和IV的简化形式,使用出生季度工具变量来估计学校教育的经济回报(录自:Angrist和Krueger, 1991)。

图4.1.1所讲述的故事的数学表示来自第一阶段和简化形式的回归方程,具体如下:
方程(4.1.4a)中的参数 给出了在对协变量 进行了调整的情况下 的第一阶段效应。方程(4.1.4b)中的参数 给出了在对协变量 进行了调整的情况下 的简化形式效应。在Angrist and Krueger(1991)中,工具变量 是出生季度(或表示出生季度的虚拟变量),协变量是出生年份和出生地情况的虚拟变量。用SEM的语言来说,这两个方程中的因变量被称为内生变量(在系统内部共同确定),而右边的变量被称为外生变量(在系统外部确定)。工具变量 是外生变量的子集。不是工具变量的外生变量被称为外生协变量。虽然在这种情况下,我们并不是在评估传统的供需方程组,但这些SEM变量称谓仍然在实证实践中广泛使用。协变量调整的IV估计量是比率 的样本对应物。要看到这一点,请注意简化形式和第一阶段系数的分母是相同的。因此,它们的比率为:
式中 对外生协变量 的回归残差。因此,等式(4.1.5)右边的 就替换成了等式(4.1.3)中的 。计量经济学家将方程(4.1.5)的样本对应物称为带有协变量的因果模型中 的间接最小二乘(ILS)估计量,
其中 为复合误差项 。用等式(4.1.6)很容易直接证得 因为根据构造 无关,而根据假设它也与 无关。

注释

[1]近年来,统计学家越来越愿意在一个明确的因果框架中讨论观测数据的统计模型;例如,参见Freedman(2005)的评论。

[2]这里的重要历史参考文献是Wald(1940)和Durbin(1954),这两篇文章都在本章后面进行了讨论。

[3] 参见Angrist和Krueger(2001)对IV的历史和使用的简要阐述,Stock和Trebbi(2003)对IV诞生的详细描述,以及Morgan(1990)对计量经济学思想的扩展性历史的讨论,其中就包括了对联立方程模型的讨论。

[4]其他的解释也是可能的,最有可能的是与出生季节相关的某种家庭背景效应(见Bound, Jaeger和Baker, 1995)。与忽略家庭背景影响的可能性进行权衡的事实是,在受义务教育法影响最大的教育水平上,在平均受教育水平上出生季度模式最为明显。




本专栏主理人简介

企研数据学术顾问 · 李井奎


李井奎,1978年1月生,浙江工商大学经济学院教授、博士生导师,哈佛大学访问学者,以教书育人和传播学问为己任,曾获浙江省“高校优秀教师”称号。除学术论文写作之外,还著有《大侦探经济学:现代经济学的因果推断革命》等科普著作。




星标⭐我们不迷路!想要文章及时到,文末“在看”少不了!

点击搜索你感兴趣的内容吧

往期推荐


数据可视化 | 讲究!用 Python 制作词云图学问多着呢

大数据分析 | 用 Python 做文本词频分析

数据治理 | 一文看懂GIT的基本原理!

软件应用 | 自给自足,免费分享!TVP-VAR(时变参数向量自回归模型)MATLAB代码(作图修改版)

基本无害 | 使回归有意义 —— 附录:平均倒数加权函数的推导

基本无害 | 使回归有意义——回归的细节(全)





数据Seminar




这里是大数据、分析技术与学术研究的三叉路口


文 | 《基本无害的计量经济学——实证研究者指南(重译本)》

翻译 | 李井奎

校对 | 陈泽 王锐

排版 | 彭绮荣


    欢迎扫描👇二维码添加关注    

点击下方“阅读全文”了解更

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存