工具＆方法丨使用双重差分难？文献中的五套方法解惑

数据Seminar 2021-06-03

The following article is from 计量经济学及Stata应用 Author 陈强

双重差分法（Difference-in-differences，简记DID）无疑是实证研究中最常用的计量方法之一，而交互项则是DID的灵魂。在计量实践中，取决于数据的类型与性质，DID的交互项有着不同的形式。灵活地使用DID的交互项，是实证研究的一项重要技能。为此，本文全面地梳理了文献中关于DID交互项的各种形式，包括——

（1）传统DID；

（2）经典DID；

（3）异时DID；

（4）广义DID；

（5）异质性DID。

传统DID

双重差分法是研究“处理效应”（treatment effects）的流行方法。一般来说，DID的使用场景为，在面板数据中，个体可分为两类，即受到政策冲击的“处理组”（treatment group）与未受政策影响的“控制组”（control group）。为此，引入处理组虚拟变量：

然而，处理组的个体也只有到了处理期才会受到政策冲击（之前未受冲击），故引入处理期虚拟变量：

传统DID的模型设定为：

其中，处理组虚拟变量捕捉了处理组的组别效应（处理组与控制组的固有差别），处理期虚拟变量控制了处理期的时间效应（处理期前后的固有时间趋势），为其他控制变量，而交互项则代表了处理组在处理期的真正效应，其系数正是我们关心的处理效应。然后进行OLS估计即可。

经典DID

DID使用了面板数据，而估计面板模型的标准方法为“双向固定效应模型”（two-way fixed effects），它既控制了“个体固定效应”（individual fixed effects），也控制了“时间固定效应”（time fixed effects）。研究者后来发现，虽然传统DID控制了处理组的组别效应（）与处理期的时间效应（）；但其实还可以做得更好，干脆引入双向固定效应模型，我们称之为“经典DID”：

其中，为个体固定效应（在回归时加入个体虚拟变量即可），为时间固定效应（在回归时加入时间虚拟变量即可），而交互项之前的系数依然是我们感兴趣的处理效应。显然，加入个体固定效应之后，就不必再放入处理组虚拟变量；否则，将导致严格多重共线性，因为前者包含比后者更多的信息（前者控制到个体层面，而后者仅控制到组别层面）。

类似地，加入时间固定效应之后，就不必再放入处理期虚拟变量；否则，将导致严格多重共线性，因为前者包含比后者更多的信息（前者控制了每一期的时间效应，而后者仅控制处理期前后的时间效应）。估计方法依然是OLS，但须使用“聚类稳健标准误”（cluster-robust standard errors），因为面板数据一般为“聚类数据”（cluster data）。这种经典DID的模型设定在实证研究中最为常见。

异时DID

在传统与经典DID的模型设定中，一个隐含假设是，处理组的所有个体开始受到政策冲击的时间均完全相同。但有时也会遇到每位个体的处理期不完全一致的情形（heterogeneous timing）；比如，某项试点政策在不同城市分批推出。此时，可使用“异时DID”（heterogeneous timing DID）。

异时DID的关键在于，既然每位个体的处理期不完全一致，则处理期虚拟变量也因个体而异，故应写为（既依赖于个体 i，也依赖于时间 t）。具体而言，异时DID的模型设定为：

在具体实施时，可在Stata中首先定义因个体而异的处理期虚拟变量。比如，考虑一个五期面板，对于第1位个体，；对于第2位个体，；而对于第3位个体，。这意味着，第1位个体从第3期开始受到政策处理，第2个体从第4期开始受到政策冲击，而第3位个体从未受到政策冲击（属于控制组）；以此类推。

广义DID

以上各种DID方法均假设存在处理组与控制组的区别，但有时某项政策在全国统一铺开，此时只有处理组，并没有控制组，是否还能使用DID呢？答案是“能”，可以尝试“广义DID”（generalized DID）。

使用广义DID的重要前提是，虽然所有个体均同时受到政策冲击，但政策对于每位个体的影响力度并不相同，不妨以来表示。

一个经典研究是 Bai and Jia (2016, Econometrica) 使用清朝的府级面板数据，考察废除科举制对于革命起义的影响。由于科举制于1911年在全国统一废除，故不存在严格意义上的控制组。但由于各地科举配额的巨大差异，废除科举对于各地的影响力度差别很大。

直观上，如果某个府本来的科举配额微乎其微，则废除科举当然影响很小；反之，对于科举配额很多的府，废除科举则可能引发剧烈震动，因阻断很多士子的上升空间而导致革命。为此，Bai and Jia (2016) 以“科举配额占人口比重”作为对于的度量。

在实践中，只要寻找到合适的变量（一般从经济理论出发来寻找），则可以之替代经典DID的虚拟变量，将广义DID模型设定如下：

其中，交互项之前的系数依然是我们关心的处理效应，然后对上式进行OLS估计。

当然，对于广义DID，文献中也曾出现更为“简单粗暴”的处理方法，即人为地设定一个门槛值 c，根据变量是否超过此门槛值来定义处理组与控制组。具体来说，定义

然后，按照经典DID来处理。这种处理方法的缺点在于，门槛值 c 的设定比较主观，一般须进行“稳健性检验”（robustness checks），即考察不同门槛值下的回归结果是否稳定。另外，在将连续变量压缩为二分变量的时候，显然损失了不少信息，故在实践中已不多见。

异质性DID

传统的处理效应模型一般假设“同质性处理效应”（homogeneous treatment effects），即所有个体的处理效应都相同。显然，此假定太苛刻，在实践中难以成立。更为合理的假定则为“异质性处理效应”（heterogeneous treatment effects），即允许每位个体的处理效应不尽相同。

在DID的框架下，也可引入异质性处理效应，关键仍在于对交互项的调整。为简单起见，假设根据经济理论，可将所有个体分为两类，以虚拟变量来表示。在理论上，我们预期这两类个体的处理效应并不相同。此时，可在经典DID的模型中，再引入三重交互项，构建异质性DID模型：

由上式可知，对于那类处理组个体，其处理效应为。而对于那类处理组个体，其处理效应为。显然，对于或的这两类个体，其处理效应是异质的（只要三重交互项的系数

显著）。

推而广之，如果经济理论认为，应将所有个体分为 M 类，以考察这 M 类个体的异质性效应，则可设立 (M -1) 个类别虚拟变量，比如，然后分别生成三重交互项，引入回归方程中：

在上式中，第 1 类个体的处理效应为，第 2 类个体的处理效应为

，以此类推。然后照常进行OLS估计即可。

当然，双重差分法还有其他变种，比如三重差分法（Difference-in-differences-in-differences，简记DDD），以及与倾向得分匹配相结合的PSM-DID 等，有兴趣的读者可参考陈强（2014）。

_________________________________________

参考文献

陈强，《高级计量经济学及Stata应用》，第2版，高等教育出版社，2014年

陈强，《计量经济学及Stata应用》，高等教育出版社，2015年

陈强，《机器学习及R应用》，高等教育出版社，2020年（即将出版）

►往期推荐

回复【Python】👉简单有用易上手

回复【学术前沿】👉机器学习丨大数据

回复【数据资源】👉公开数据

回复【可视化】👉你心心念念的数据呈现

回复【老姚专栏】👉老姚趣谈值得一看

►一周热文

工具＆方法丨使用R语言的正确姿势，R包干货奉献

特别推荐丨老姚专栏：漫谈科学三则

学术前沿 | 机器学习如何改变劳动力市场？

工具＆方法丨关于交互项的那些事（四）：非线性模型中的交互效应

数据呈现 | Stata+R绘图：小提琴图，展示不同地区婚姻市场状况

数据Seminar

这里是大数据、分析技术与学术研究的三叉路口

作者：陈强出处：计量经济学及Stata应用推荐：简华（何年华）编辑：青酱

欢迎扫描👇二维码添加关注

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…

近视的孩子有救了！国内最新近视防控矫正技术，不手术，扫码进群即可了解！

法明传[2024]173号：1月1日起，未用示范文本提交起诉状，部分法院将不予立案