查看原文
其他

工具&方法丨使用双重差分难?文献中的五套方法解惑

数据Seminar 2021-06-03

The following article is from 计量经济学及Stata应用 Author 陈强

双重差分法(Difference-in-differences,简记DID)无疑是实证研究中最常用的计量方法之一,而交互项则是DID的灵魂。在计量实践中,取决于数据的类型与性质,DID的交互项有着不同的形式。灵活地使用DID的交互项,是实证研究的一项重要技能。为此,本文全面地梳理了文献中关于DID交互项的各种形式,包括——

(1)传统DID;

(2)经典DID;

(3)异时DID;

(4)广义DID;

(5)异质性DID。





传统DID


双重差分法是研究“处理效应”(treatment effects)的流行方法。一般来说,DID的使用场景为,在面板数据中,个体可分为两类,即受到政策冲击的“处理组”(treatment group)与未受政策影响的“控制组”(control group)。为此,引入处理组虚拟变量  

然而,处理组的个体也只有到了处理期才会受到政策冲击(之前未受冲击),故引入处理期虚拟变量

传统DID的模型设定为 :

其中,处理组虚拟变量  捕捉了处理组的组别效应(处理组与控制组的固有差别),处理期虚拟变量  控制了处理期的时间效应(处理期前后的固有时间趋势), 为其他控制变量,而交互项  则代表了处理组在处理期的真正效应,其系数  正是我们关心的处理效应。然后进行OLS估计即可。




经典DID


DID使用了面板数据,而估计面板模型的标准方法为“双向固定效应模型”(two-way fixed effects),它既控制了“个体固定效应”(individual fixed effects),也控制了“时间固定效应”(time fixed effects)。研究者后来发现,虽然传统DID控制了处理组的组别效应()与处理期的时间效应();但其实还可以做得更好,干脆引入双向固定效应模型,我们称之为“经典DID”:

其中, 为个体固定效应(在回归时加入个体虚拟变量即可), 为时间固定效应(在回归时加入时间虚拟变量即可),而交互项  之前的系数  依然是我们感兴趣的处理效应。显然,加入个体固定效应  之后,就不必再放入处理组虚拟变量 否则,将导致严格多重共线性,因为前者包含比后者更多的信息(前者控制到个体层面,而后者仅控制到组别层面)。

类似地,加入时间固定效应  之后,就不必再放入处理期虚拟变量 否则,将导致严格多重共线性,因为前者包含比后者更多的信息(前者控制了每一期的时间效应,而后者仅控制处理期前后的时间效应)。估计方法依然是OLS,但须使用“聚类稳健标准误”(cluster-robust standard errors),因为面板数据一般为“聚类数据”(cluster data)。这种经典DID的模型设定在实证研究中最为常见。




异时DID


在传统与经典DID的模型设定中,一个隐含假设是,处理组的所有个体开始受到政策冲击的时间均完全相同。但有时也会遇到每位个体的处理期不完全一致的情形(heterogeneous timing);比如,某项试点政策在不同城市分批推出。此时,可使用“异时DID”(heterogeneous timing DID)。

异时DID的关键在于,既然每位个体的处理期不完全一致,则处理期虚拟变量也因个体而异,故应写为 (既依赖于个体 i,也依赖于时间 t)。具体而言,异时DID的模型设定为:

在具体实施时,可在Stata中首先定义因个体而异的处理期虚拟变量 比如,考虑一个五期面板,对于第1位个体,对于第2位个体,而对于第3位个体,这意味着,第1位个体从第3期开始受到政策处理,第2个体从第4期开始受到政策冲击,而第3位个体从未受到政策冲击(属于控制组);以此类推。




广义DID


以上各种DID方法均假设存在处理组与控制组的区别,但有时某项政策在全国统一铺开,此时只有处理组,并没有控制组,是否还能使用DID呢?答案是“能”,可以尝试“广义DID”(generalized DID)。

使用广义DID的重要前提是,虽然所有个体均同时受到政策冲击,但政策对于每位个体的影响力度并不相同,不妨以  来表示。

一个经典研究是 Bai and Jia (2016, Econometrica) 使用清朝的府级面板数据,考察废除科举制对于革命起义的影响。由于科举制于1911年在全国统一废除,故不存在严格意义上的控制组。但由于各地科举配额的巨大差异,废除科举对于各地的影响力度差别很大。

直观上,如果某个府本来的科举配额微乎其微,则废除科举当然影响很小;反之,对于科举配额很多的府,废除科举则可能引发剧烈震动,因阻断很多士子的上升空间而导致革命。为此,Bai and Jia (2016) 以“科举配额占人口比重”作为对于  的度量。

在实践中,只要寻找到合适的  变量(一般从经济理论出发来寻找),则可以之替代经典DID的  虚拟变量,将广义DID模型设定如下:

其中,交互项  之前的系数  依然是我们关心的处理效应,然后对上式进行OLS估计。

当然,对于广义DID,文献中也曾出现更为“简单粗暴”的处理方法,即人为地设定一个门槛值 c,根据  变量是否超过此门槛值来定义处理组与控制组。具体来说,定义

然后,按照经典DID来处理。这种处理方法的缺点在于,门槛值 c 的设定比较主观,一般须进行“稳健性检验”(robustness checks),即考察不同门槛值下的回归结果是否稳定。另外,在将连续变量  压缩为二分变量  的时候,显然损失了不少信息,故在实践中已不多见。




异质性DID


传统的处理效应模型一般假设“同质性处理效应”(homogeneous treatment effects),即所有个体的处理效应都相同。显然,此假定太苛刻,在实践中难以成立。更为合理的假定则为“异质性处理效应”(heterogeneous treatment effects),即允许每位个体的处理效应不尽相同。

在DID的框架下,也可引入异质性处理效应,关键仍在于对交互项  的调整。为简单起见,假设根据经济理论,可将所有个体分为两类,以虚拟变量  来表示。在理论上,我们预期这两类个体的处理效应并不相同。此时,可在经典DID的模型中,再引入三重交互项 ,构建异质性DID模型:

由上式可知,对于  那类处理组个体,其处理效应为 而对于  那类处理组个体,其处理效应为 显然,对于 的这两类个体,其处理效应是异质的(只要三重交互项的系数 

显著)。

推而广之,如果经济理论认为,应将所有个体分为 M 类,以考察这 M 类个体的异质性效应,则可设立 (M -1) 个类别虚拟变量,比如 ,然后分别生成三重交互项 ,引入回归方程中:

在上式中,第 1 类个体的处理效应为 ,第 2 类个体的处理效应为 

,以此类推。然后照常进行OLS估计即可。

当然,双重差分法还有其他变种,比如三重差分法(Difference-in-differences-in-differences,简记DDD),以及与倾向得分匹配相结合的PSM-DID 等,有兴趣的读者可参考陈强(2014)。


_________________________________________

参考文献

陈强,《高级计量经济学及Stata应用》,第2版,高等教育出版社,2014年

陈强,《计量经济学及Stata应用》,高等教育出版社,2015年

陈强,《机器学习及R应用》,高等教育出版社,2020年(即将出版)









►往期推荐

回复【Python】👉简单有用易上手

回复【学术前沿】👉机器学习丨大数据

回复【数据资源】👉公开数据

回复【可视化】👉你心心念念的数据呈现

回复【老姚专栏】👉老姚趣谈值得一看


►一周热文

工具&方法丨使用R语言的正确姿势,R包干货奉献

特别推荐丨老姚专栏:漫谈科学三则

学术前沿 | 机器学习如何改变劳动力市场?

工具&方法丨关于交互项的那些事(四):非线性模型中的交互效应

数据呈现 | Stata+R绘图:小提琴图,展示不同地区婚姻市场状况










数据Seminar

这里是大数据、分析技术与学术研究的三叉路口


作者:陈强出处:计量经济学及Stata应用推荐:简华(何年华)编辑:青酱







    欢迎扫描👇二维码添加关注    


    您可能也对以下帖子感兴趣

    哪本研究方法教科书适合我:进阶篇 | 学科教学
    增值税留抵退税政策对企业绿色创新效率的影响研究
    赵海益 彭锻炼|数字技术对城乡劳动力就业分布影响研究
    刘志阳 孙孟子 陆亮亮|数字技术使用对农户公益参与的影响
    公共数据开放对城乡居民收入增长的积极影响

    文章有问题?点此查看未经处理的缓存