前沿: 双重稳健DID, 给你的DID加一把锁！

Original 计量经济圈计量经济圈 2022-05-11

收录于合集 #实证研究中常用计量方法小集子 107个

凡是搞计量经济的，都关注这个号了

稿件：econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

正文

关于下方文字内容，作者：吴青叶，澳大利亚国立大学商学与经济学院，通信邮箱：qingye.wu@anu.edu.au

作者之前的文章：

①Mita, 2020小诺奖RDD女王最具影响力的成名作, 附数据和计量程序

②选择模型真用对了吗? 扒一扒75篇顶级外刊的真相, 并献上最权威的使用策略

Pedro H.C.Sant, AnnaJunZhao. (2020). Doubly robust difference-in-differences estimators. Journal of Econometrics.
This article proposes doubly robust estimators for the average treatment effect on the treated (ATT) in difference-in-differences (DID) research designs. In contrast to alternative DID estimators, the proposed estimators are consistent if either (but not necessarily both) a propensity score or outcome regression working models are correctly specified. We also derive the semiparametric efficiency bound for the ATT in DID designs when either panel or repeated cross-section data are available, and show that our proposed estimators attain the semiparametric efficiency bound when the working models are correctly specified. Furthermore, we quantify the potential efficiency gains of having access to panel data instead of repeated cross-section data. Finally, by paying particular attention to the estimation method used to estimate the nuisance parameters, we show that one can sometimes construct doubly robust DID estimators for the ATT that are also doubly robust for inference. Simulation studies and an empirical application illustrate the desirable finite-sample performance of the proposed estimators. Open-source software for implementing the proposed policy evaluation tools is available.

摘要：

本文提出了将DR估计方法用在了DID模型中的实验组效果平均值（ATT）。与DID估计量相比，如果一个倾向得分或者结果回归模型被正确地设定，那么这个估计量是一致的。此外，作者还推导了在面板数据或者重复截面数据的情况下，在DID模型中ATT的半参数有效界，并证明当模型被正确设定时，作者提出的估计量可以获得半参数有效界。此外，作者量化了使用面板数据而不是重复截面数据的潜在效率收益。最后，作者证明了有时为ATT构造的双鲁棒估计量对统计推断来说也是双鲁棒的。

一、简介

DID是研究者采用的最热门的利用观测数据进行政策评估的方法。在其经典模型中，DID 通过比较两组实验前后的结果差异确定实验组效果平均值：一个组进行了实验，另外一个组作为对照。为了便于进行因果解释，研究者通常引用平行趋势假设（PTA）：在没有进行实验前，实验组和对照组的平均值在一段时间内是平行的。尽管PTA从根本上是不可测试的，它的可信度也通常受到质疑：如果观测到的特征被认为与结果的演变相关，并且结果的演变在两个组之间是不平衡的。在这种情况下，研究者通常偏离规范的DID模型设置，并将实验前的协变量纳入DID模型分析中，并假设只有在这些协变量条件下，PTA才满足。

在文章中，作者研究了基于协变量的条件使得PTA假设满足的情况下，DID模型中ATT的估计量的稳健性和有效性。作者既考虑了面板数据的情况，也考虑了仅有重复截面数据的情况。作者在不同方面对DID的研究做出了贡献。首先，作者推出了在DID模型设定下用DR方法对ATT进行的估计，并证明了当倾向评分和结果模型被正确设定时，DR方法估计的结果是一致的。作者提出了用DR方法进行两种不同的对ATT的估计，它们同在实验组中，但是一个是基于处理前的结果回归，一个是基于处理后的结果回归。尽管如此，作者发现DR方法估计量并不依赖于这样的选择。

其次，作者推导了在DID设计下ATT的半参数有效界。作者推导出来的半参数有效界是非参数的，因为作者没有假设研究者会对倾向评分函数和结果回归函数有一定的了解。因此，这些边界提供了一个标准，研究人员可以基于这个标准比较ATT的任何半参数的DID估计量。还值得强调的是，这些半参数有效界明确地包含了所有识别假设隐含的限制。重要的是，这些限制的不同取决于是否是面板数据还是重复截面数据。在这两种情况下，它们都涉及了条件PTA所隐含的限制，但是，当有重复截面数据时，它们也包括了识别假设所隐含的约束，即协变量与处理状态的联合分布不受采样周期的影响。需要强调的是，如果不考虑这些隐含约束，则会导致推导出的效率边界出现差异，而这反过来又可能表明某些估计量是半参数有效的，而实际上并非如此。

有了半参数有效界，就可以回答一些问题。例如，人们可能会疑问，使用面板数据而不是重复截面数据是否会提高效率。通过直接对比这两种设定下的有效界，不仅可以看出上述问题的回答是肯定的，还可以看出，当实验前后重复截面数据的样本容量越不平衡时，这种增益往往越大。

作者探讨的另一个问题是，文章所提出的用DR方法对DID模型进行估计的估计量是否能达到半参数有效界。作者表明，当倾向评分工作模型和对照组结果回归模型被正确设定时， DR DID估计量在面板数据设定下是局部有效的，但是在截面数据设定下则不是。事实上，当只有重复截面数据时，作者发现只要依赖于倾向评分模型和实验组和对照组的结果回归模型被正确设定时，DR DID估计量可以达到半参数有效界。作者量化了使用低效的DR DID估计量而不是局部有效估计量的效率损失，并通过蒙特卡洛模拟说明这种损失确实很大。

文章提出的方法适用于干扰函数的线性和非线性的工作模型。当通用参数工作模型用于干扰函数时，作者建立了DR DID估计量的相合性和渐近正态性。作者提出的估计量的渐进方差的正确形式取决于倾向评分和/或结果回归模型是否被正确设定。鉴于实际应用过程中，并不知道哪些模型是被正确设定的，所以研究者在估计渐进方差是应该考虑所有第一步估计量的估计效果，如果不这样做，可能会导致无效的统计推断。

文章的第三个贡献是，通过观察用于估计多余参数的估计方法，有些时候可能会建立可计算的简单的DID模型中ATT的估计量，不仅是DR一致和局部半参数有效，而且还是双稳健性的。

二、相关文献

文章的理论架构主要建立在因果推断研究的两个分支上。首先，文章的方法论与其他DID文献有内在的联系，例如Imbens和Wooldridge（2009）的第6.5节及其参考文献。这个分支与文章相关的两项主要贡献是Heckman等人1997年提出的基于核函数的DID模型回归估计量，以及Abadie（2005）提出的（参数与非参数）DID逆概率加权（IPW）估计量。作者注意到，当协变量的维度很高甚至只是适中时，完全非参数方法通常不会给出有用的推断。在这种情况下，研究人员通常采用参数化方法。文章提出的DR DID则属于后一种。

第二，文章的内容也与双稳估计的经典文献密切相关，例如，Robins et al.(1994), Scharfstein et al.(1999), Bang and Robins(2005), Wooldridge(2007), Chen et al.(2008), Cattaneo(2010), Graham et al.(2012,2016), Vermeulen&Vansteelandt(2015), Lee et al.(2017), Sloczynski & Wooldridge(2018) 和 Seaman&Vansteelandt(2018)。近期，DR估计方法在使用自适应数据和用机器学习估计干扰函数也发挥了重要的作用，例如，Belloni等人（2014）、Farrell（2015）、Chernozhukov等人（2017）、Belloni等人（2017）和Tan（2019）。另一方面，作者注意到，上述的论文集中在“观测值的选择模型”或者“IV/LATE”类型的假设上，而作者特别观者了条件DID模型设计，所以文章的结果是对已有研究的一个补充。

为了在DID框架下推导ATT估计量的半参数有效界，文章建立在Hahn（1998）和Chen等人（2008）研究的基础上。尽管作者遵循了上述论文推导半参数有效界的结构，但是作者推导的半参数有效界补充了他们的研究，因为他们的结果依赖于截面数据设置下的“选择模型”类型的假设而作者的研究集中于DID的模型设计。

而对DR DID估计量进一步改进的研究建立在Vermeulen&Vansteelandt（2015）的研究上，他们提出了在可观测类型的选择假设下在截面数据设置中用于统计推断的DR估计量。文章的内容也建立在Graham等人（2012）的基础上，因为他们提出的倾向评分估计量是文章的一个重要组成部分。

最后，与文章相关但独立于文章内容的是Zimmert（2019）的研究工作，他提出了在高层次条件下，研究者可以使用机器学习第一步估计量来估计DID模型中的ATT统计量。他的研究结果补充了作者的研究结果，但是作者注意到他提出的关于重复截面情况的估计没有达到作者推导的半参数有效界，而且效率损失也是一阶重要的。同时作者也注意到Zimmert（2019）并没有提供面板数据和重复截面数据应用之间的详细比较，也没有讨论DR的推断过程，而这些过程在模型被错误设定时非常相关。

三、DID模型

1、背景

文章中将会使用的模型符号如下：

为了评估结论与模型表示的敏感性，作者考虑了三种不同的模型表达：（i）线性模型，其中所有协变量是线性的；（ii）基于DW，在线性模型基础上增加年龄的平方，年龄的立方除以1000，受教育年限的平方，1974年零收入的虚拟变量，受教育年限和1974年实际收入的乘积变量；（iii）在DW的模型表达上，增加了已婚和1974年实际收入的乘积变量，已婚和1974年零收入的乘积变量。

表3总结了结果。正如ST指出的，这些相对偏差对于比较每个样本内的DID估计量是有用的，但是由于ATT的实验基准在三个实验样本之间有很大差异，所以不应该用于样本间的比较。表3还反映了其他一些现象。首先，基于双向固定效应回归模型的估计量在不同模型表示中都比较稳定，但是都显示出了正向显著的评估偏差；第二，基于回归方法的DID估计量会引致最精确的估计值。但是，在Lalonde样本中，点估计严重低估，导致显著的评估偏差。Abadie的IPW估计量在所有估计量中有最大的标准误，但是其评估偏差相对较小。与蒙特卡洛模拟结果一样，标准化后的IPW估计量可以提高估计的稳定性。最后，作者发现，DR DID估计量既有Adadie的IPW估计量小评估误差的优点，也比其有更小的标准差。同时通过比较，作者发现他们提出来的DR DID估计量是现有DID框架的一个有价值的替代方案。

七、总结

在DID模型下，当基于实验前协变量的并行趋势假设满足时，作者提出了对ATT的双重稳健估计。当倾向评分模型或结果回归模型的其中一个模型被正确指定时，作者提出的估计量存在一致性。当工作模型的干扰模型也被正确指定时，可以得出半参数有效界。同时作者也通过蒙特卡洛模拟和实证应用，证实了这个估计量可以作为因果推断工具。

下面这些短链接文章属于合集，可以收藏起来阅读，不然以后都找不到了。

2.5年，计量经济圈近1000篇不重类计量文章，

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle

故意按摩让女生“产生欲望”后发生关系，算性侵吗？

洗牌电商圈！阿哲放话全网：挑战抖音所有机制！爆全品类大牌！

阿哲现身评论区，@一修！肉肉痛哭，无限期停播！回应舆论黑料，关闭私信评论区！

登热榜！某牙电母被S，榜一求爱遭拒！柚柚阿哲合体年度走红毯！

小敏感喊话阿哲，出镜抖音！欠钱不还，小白龙再被扒借贷官司！

前沿: 双重稳健DID, 给你的DID加一把锁！

您可能也对以下帖子感兴趣

故意按摩让女生“产生欲望”后发生关系，算性侵吗？

洗牌电商圈！阿哲放话全网：挑战抖音所有机制！爆全品类大牌！

阿哲现身评论区，@一修！肉肉痛哭，无限期停播！回应舆论黑料，关闭私信评论区！

登热榜！某牙电母被S，榜一求爱遭拒！柚柚阿哲合体年度走红毯！

小敏感喊话阿哲，出镜抖音！欠钱不还，小白龙再被扒借贷官司！

生成图片，分享到微信朋友圈

前沿: 双重稳健DID, 给你的DID加一把锁！

您可能也对以下帖子感兴趣