名家新作 | 哥大姜纬教授：工具变量会让我们更接近真实吗？

数量经济学 2022-07-01

来源：中国会计学刊、上海财经大学金融学院；

原标题：名家新作 | 姜纬（Wei Jiang）教授谈工具变量

工具变量法是为了缓解内生性问题而经常使用的一种方法。但工具变量的有效性与使用过程中的谨慎性一直是学术界关心的问题。2010年，Journal of Accounting and Economics曾发表一篇题为On the Use of Instrumental Variables in Accounting Research的论文。该文发现1995-2005年JAR、JAE和TAR三大会计顶级期刊共有42篇论文使用了工具变量。基于这些文章，该文识别了工具变量法优于OLS估计的适用条件以及使用工具变量需要做的一系列检验。

七年之后的今天，国际著名金融学家、RFS主编、哥伦比亚大学商学院讲席教授姜纬（Wei Jiang）教授推出新作：Have Instrumental Variables Brought Us Closer to the Truth？该文对JF、JFE和RFS三大金融顶级期刊中255篇运用工具变量进行回归估计的论文进行研究后发现，工具变量估计法将回归估计系数平均扩大了九倍。针对该项“难以置信”的扩大效应，姜纬教授在论文中做了相关解释，同时也为运用工具变量估计方法做因果推断的学者提供了宝贵建议。我们将该篇的核心观点摘录于下，文章全文请见Review of Corporate Financial Studies。

现象：工具变量增大了估计参数

2003至2014年间，发表于国际三大金融顶级期刊（JF、JFE、RFS）的论文中，有255篇运用了工具变量法（如下图）。

相比于OLS回归，工具变量的运用使得估计参数平均扩大了九倍。姜纬教授将内生性问题根据OLS回归系数偏差的方向分为了三大类：正向性内生问题、矫正性内生问题、不确定性内生问题。255篇文章中67.1%的文章存在正向性内生问题，在这类研究中，运用OLS回归分析时所估计的系数会高估总体平均处理效应（population average treatement effect）。理论上，在存在正向性内生问题的研究中，我们预期IV回归系数应该要小于OLS 回归系数。但姜纬教授发现，在这类情况下，仍然有79.8%的研究在运用工具变量法缓解内生性问题后，其结果反而扩大了其估计系数。那这是什么原因呢？

原因：局部平均处理效应、弱工具变量及发文有偏

针对工具变量回归估计所带来的“难以置信”的扩大效应，姜纬教授从以下三大方面找寻了原因。

首先，“局部平均处理效应”(LATE) 有可能会使工具变量法估计的系数被扩大。“局部平均处理效应”是由异质性产生，即每个个体的处理效应（treatment effect）是不同的。在这种情况下，工具变量的采用有可能造成只衡量了处理组一部分个体的平均处理效应，而非处理组的平均处理效应。姜纬教授在文中举了一个劳动经济学的经典问题来说明局部平均处理效应对IV结果的影响。以往的研究中，学者发现教育对收入的影响研究面临很大的内生性问题。比如，能力强的人更有可能接受更高层次的教育，而这部分人也更有能力获得更高的报酬。在此类研究中，“是否居住在大学周围”确实是一个不错的工具变量，因为考虑教育成本等因素，距离学校的远近会影响是否接受大学教育的选择，但这又和一个人的能力、天赋没有很大的相关性。但是，距离学校的远近只会影响上大学的个体中对教育成本敏感的个体的抉择；对于那些无论如何都会去上大学的个体来讲，距离学校多远多近都不会改变他们的抉择。这就是典型的局部平均处理效应。在这种情况下，教育成本敏感个体的教育回报可能会远远大于无论就近是否有学校都不会去上大学个体/会去上大学个体的教育回报。因此，在计量上这类局部平均处理效应会造成IV的估计系数比OLS的估计系数大。

其次，弱工具变量也可能使得工具变量估计系数放大。如姜纬教授文中所述，运用工具变量估计的系数与真实系数之间存在一定的区别。当外生性条件无法得到完全满足时，工具变量估计系数与真实系数之间的差值同时取决于工具变量的外生性和相关性。当工具变量为弱工具变量，即相关性很小时，会放大排除性限制(exclusion restriction)对于系数估计的影响，进而使得IV的估计系数比OLS的估计系数大。

第三，发文导向也可能导致已发表的论文中工具变量估计系数普遍偏大。一般来讲，关键变量的估计系数如若不显著则论文很难发表。使用工具变量会使样本估计方差变大，在这样的情况下，论文作者通常会偏爱于估计系数值更大的工具变量以保证估计系数显著。这也就是为什么我们在已经发表的论文中会看到工具变量法的估计系数远大于OLS估计系数。

建议：

这样看来，工具变量也许并没有让我们更加接近事实。针对这一问题，姜纬教授对研究者们提出了如下几点建议。首先，研究者应该对内生性问题进行更详尽的分析。比如内生性问题的大小以及会如何影响估计系数（正向或是负向）。姜纬教授建议研究者可以通过样本分组的方式来进行分析，对不同子样本的回归结果进行分析可以有助于找出内生性问题对原有估计的影响机制与效果。同时，当工具变量估计出现令人难以置信的结果时，研究者需要谨慎分析其中的原因。其次，研究者应该正视工具变量的效能。如前所述，如果是弱工具变量，即使通过了弱相关检验，其估计系数也会偏离其真实系数，这是研究者需要时刻谨记的。最后，研究者应该结合事实来做分析推断。举个例子，关于双层股权与掏空的研究，如果运用工具变量法研究发现大股东与管理层利用此股权结构进行掏空并损害了5%的公司价值，那这并不稀奇。但是，当你的研究结果发现他们损害了50%甚至100%的公司价值时，那就必须警惕了。这无疑也需要你再次分析其中的原因，从而进一步接近事实真相。

拓展阅读

在不借助工具变量、断点回归和随机冲击的前提下如何完成有意义的推断

首先，姜纬老师先从红酒和健康的例子出发，引出本场报告的主题。她提到简单回归发现，每天喝红酒的人身体更健康一些，从这个事实中我们可以得出什么结论？能否得出因为喝红酒所以身体更健康的结论？有人回答，不能。姜教授追问：从这个回归中，我们能够得到什么结论呢？观众积极响应：有人说有可能是因为健康的人喜欢喝红酒。“很好，”姜纬老师说, “这是一个反向的因果推断。”姜老师进一步解释：从回归结果中，我们仅仅知道喝红酒和健康状况存在显著的相关性，但是回归本身不能告诉我们两者之间是否存在因果关系。而建立因果关系是科研的重要意义所在。那么我们应该怎么做呢？通常应该借助工具变量，借助断点回归或者寻找随机冲击，来解决其中的内生问题。但是如果找不到这些工具，我们能不能完成一些有意义的学术研究呢？姜老师的讲座从六个方面阐述了如何不借助这些手段和技巧来进行一流的实证研究。

（一）处理效应并不是唯一有趣的经济学问题

平均处理效应（average treatment effect, ATE）是当前经济/金融研究中最受推崇的推断方法。但由于条件苛刻，在大多数情况下并不能实现，使得ATE并不能发挥作用。但是我们可以通过选择效应（selection effect）来帮助我们达成目的。例如在Jiang, Nelson, and Vytlacil (2014, RFS)的研究中，使用某个主要的全国性的住房抵押贷款银行的数据，研究了证券化与贷款业绩表现之间的关系。以往的研究发现筛选努力与事前的贷款销售概率之间存在负相关性。与此不同，这篇论文发现从事后而言，银行资产负债表上留存的贷款比出售的贷款有更高的不良比率。这似乎和我们的直觉相反。为什么会得到这样的结果呢？这篇论文明确区分贷款业绩与贷款出售之间的事前事后关系。事前关系是银行在决定是否发起贷款时所认为的关系，事后关系适用于贷款发起和出售期间的关系。事前事后产生了相反的结论，主要是因为投资者存在选择效应，只有质量好的贷款才能在二级市场出售，因而导致了如此关系。

另一个例子是来自Mulligan and Rubinstein(2008, QJE)的关于“女性相对工资”研究，该项研究发现，1970年到1990年，性别间的平等程度变化线（用女性工资中位数除以男性工资中位数来表示）与性别内的不平等程度变化线（用90分位的男性工资除以10分位的男性工资表示）趋势是一致的。为什么会产生这种现象呢，这是因为选择效应的存在，当女性逐步进入劳动力市场时，只有聪明的女性在与男性的竞争中能够在劳动力市场上留下来，数据不能观测到未参与工作的女性，因而导致了这个现象的存在。

（二）配对固定效应

什么是固定效应，固定效应有什么好处呢？在大多数面板数据中，固定效应都可以吸收大部分随时间不变的内生性，但并不能处理随时间变化的内生性。固定效应在处理内生性匹配层面表现除了相当强大的力量，但是需要提前分类数据。在Jiang, Wan, and Zhao(2016, RFS)的研究中，当董事会组成和会议议程都是内生的时候，可以对董事会的分歧做出解释吗？除非个体的投票数据是可以采用的，然后内生性匹配就可以通过固定效应被吸收掉。多维的固定效应可以作为控制变量完备集合的替代。有的研究甚至只有一个回归元，例如Fisman, Paravisini, and Vig (2017, AER)，文章的表四只包含了一个“Same Group”回归元，通过使用的是来自印度银行的办公人员和借款人的宗教、种族的二元匹配数据，借此来表明，贷款人和借款人之间的文化接近度（共同的守则、信仰和种族等）增加了信贷的数量，并减少了还款违约。

如果不平衡集群的原因和内生性有关，那么固定效应可能会失效，这时候可以通过寻找一个共同的比较对象来解决。比如说，现在要选择一个学生，有两个对象可供选择，都是财大的，一个来自经济学院，GPA为3.6；另一个是金融学院，GPA为3.7，给定这些信息我应该怎么选，有同学愿意回答一下吗？似乎没法选，因为两个同学来自不同的群体，GPA的直接比较不再具有参考性。但假设两个同学之间有一个可以共同比较的同学，是不是这两个同学就建立了间接的关系？在Brav, Jiang, Li (2017; early stage)关于投票代理权角逐中对冲基金与机构投资者的关系研究中就作出了这样的处理。研究发现，基金并不会在所有的代理权争夺事件中投出自己的一票；Pro-Activist衡量方法在不同事件中没有可比性；任何两只基金都可以在他们参与投票的代理权争夺事件的基础上进行比较；基金的相对排名可以通过两两比较的方法进行分类。

（三）从预先确定的敞口中进行识别

在法律或政策变化方面的双重差分(DID)分析很常见，然而法律或政策变化几乎不是随机的。预先确定的政策敞口变化可能是一个挽救办法。一方面可以借助与政策变化合规程度（Distance to compliance）层面来探讨。在Chhaochharia and Grinstein (2007, JF)的研究中探讨了2001年至2002年的公司丑闻导致了“萨班斯法案”的影响。丑闻发生后，美国证券交易所对于规定进行了多处修改。研究发现这些规定的宣告对公司价值有重大影响。与更符合规定的公司相比，较不符合规定条款的公司能够获得正的超额收益。同样在Ahern and Dittmar (2012, QJE)关于董事会多样化的研究中提到，2003年一项新法律规定要求挪威公司董事中40％必须是女性--当时公司内只有大约9％的董事是女性。通过使用女性董事会代表的变化作为配额之后公司董事会变化的工具变量，研究发现，法律公布后，女性董事配额所引起的约束导致了公司股价大幅下滑，并且随后几年内托宾Q也大幅下滑，符合企业选择董事会实现价值最大化的理念。因为配额导致董事会平均年龄变小，经验更不足，杠杆和收购增加，经营业绩恶化。

另一方面可以借助交错周期（Pre-staggered cycles）层面来探讨。在Fos, Li, and Tsoutsoura (2017, RFS forthcoming)的研究中，通过借助选举年份变化，探讨了董事长选举与CEO周转率敏感性之间的关系，当董事会越接近下一次选举时，CEO周转率-表现-敏感度越高。在Shue and Townsend (2017, JF)的研究中探讨了股票期权如何影响CEO的风险承担，为了克服期权授予的内生性，通过利用多年度补偿计划的制度特征，在新的实值期权的大幅增加的时间点上产生了两种截然不同的变化类型。研究发现，给定样本期间的平均授予水平，授予的新期权增加10％将导致股票波动幅度增长2.8-4.2％。

当然，也可以通过一些事前敞口（Ex ante exposure）来探讨。这里的例子在中国很不适用，中国的父母需要负担自己孩子上学甚至以后买房子的开销，而大部分美国父母不会如此，因此许多学生上学会负担债务。在Fos, Liberman, and Yannelis (2017)的研究中，当学校学费增加的时候，低年级的学生比高年级学生未来的研究生入学率会降低，因为他们承担了更多的债务。在Lucca, Nadauld, Shen (2017, RFS R&R)的研究中，当学生通过贷款资助他们的教育时，贷款和学费的变化是相互关联的。较高的学费成本提高了学生的贷款需求，但是同时贷款供给也会影响到学费，例如通过放宽学生的资金限制，因而产生了内生性，为了克服这个联立方程问题，通过建立规则的敞口来识别贷款供给对学费变化的影响。

（四）反驳可能存在的其他假说

在Brav, Jiang, and Kim (2015, RFS)的研究中，用企业层面的数据来描述对冲基金主动干预的实际影响，研究发现共同基金干预企业三年后，企业的生产效率明显改善，但是应该怎么处理对冲基金主动干预的内生性呢？姜老师和她的合作者们并没有直接证明，而是通过驳斥各个可能的替代假设（包括管理层自愿改革假说，行业冲击假说和对冲基金股票选择假说）来证明他们自己提出的假设的正确性。姜老师提到，这篇文章在提交杂志审稿前，已经在40个会议上被宣讲和讨论，听众提出的问题使得他们的论文能够不断提高和优化。

（五）随机时间

大多数时间发生并不是随机的，但是发生的确切时间点是有时是随机的。这类似于停止时间模型，倾向不是随机的，但是确切的时间是随机的。如果结果取决于实际的行动，那么随机时间起作用；如果结果是取决于隐藏的行动，则随机时间不起作用。

例如，在医学研究中，最重要被治疗但是现阶段未被治疗的个体可以作为现阶段被治疗个体的对照。在Brav, Jiang, Ma, and Tian (2017, JFE R&R)的研究中提到，专利从申请到批准的周期中位数为2.5年，方差为为1.5年。专利被授权的确切时间并不在activist掌控之下，activist也并不拥有专利授权确切日期的超前信息，因而专利被授权的日期就是随机的时间。因而，对于activist所瞄准的在[t-48，t-1]个月期间提交的专利与在[t-6，t + 6]个月内被批准的专利可能是在非常类似的情况下产生。

（六）进入“因果关系”黑匣子

通常来讲，我们不能断定“X导致Y”因为我们仅仅观察到了X与Y，并没有观察到二者之间的作用过程。目前，已经有很多研究开始走入黑匣子内部来揭示影响机制。例如Schwartz-Ziv and Weisbach (2013, JFE)通过研究董事会的会议记录来评估了董事会的工作模式，管理模式还是监督模式，通过分析董事会会议花在“管理”和“监督”议程上的讨论时间来作出推断，以此揭示了董事会工作模式的黑匣子。同样在Jiang, Li, Mei (2017, JF R&R)关于基金活动家套利是否导致交易失败的研究中，通过分析可能导致交易失败的各种原因挨个筛选，最后揭示出真正的影响机制，而不是借助工具变量来解决内生性。

520+行输出do文档命令

总共10000+行do文档命令

为你的科研保驾护航

课程全程指导

更有论文写作现场学习以及写作专题课程

重要通知 | “高级计量经济学及stata应用”工作坊

十一北京约 | “高级计量经济学及stata应用”工作坊

学不好stata，还搞什么量化研究？

l 计量经济学服务中心 l

计量经济学服务中心

更懂计量，更懂你

宾曰语云被法学教授投诉：严重侵权，“违法犯罪”！

京东Plus的隐藏特权，很多会员都没领取，白交了会员费...

呼吁四川大学澄清：1998年1月，川大有多少个“姜涛与爱人程月玲”？

二湘：朱令去世一周年，清华学子控诉清华在朱令案中的冷血和无耻

多长高8厘米！国内知名专家首次公开“追高秘笈”！担心孩子长不高的家长速来！

名家新作 | 哥大姜纬教授：工具变量会让我们更接近真实吗？

您可能也对以下帖子感兴趣

宾曰语云被法学教授投诉：严重侵权，“违法犯罪”！

京东Plus的隐藏特权，很多会员都没领取，白交了会员费...

呼吁四川大学澄清：1998年1月，川大有多少个“姜涛与爱人程月玲”？

二湘：朱令去世一周年，清华学子控诉清华在朱令案中的冷血和无耻

多长高8厘米！国内知名专家首次公开“追高秘笈”！担心孩子长不高的家长速来！

生成图片，分享到微信朋友圈

名家新作 | 哥大姜纬教授：工具变量会让我们更接近真实吗？

您可能也对以下帖子感兴趣