查看原文
其他

统计计量丨双重差分法的平行趋势假定

数据Seminar 2021-06-03

The following article is from 计量经济学及Stata应用 Author 陈强

Prof. Orley Ashenfelter, architect of modern labor economics, former AEA president
双重差分法是估计处理效应的常见方法,但也有被滥用的倾向,因为有些应用者对于双重差分法的优点与局限缺乏了解,特别是其潜在的平行趋势(parallel trend)假定……





差分法的局限

经济学家常关心某政策实施后的效应,比如对于收入( y )的作用。最简单(天真)的做法是比较处理组(即受政策影响的地区或个体)的前后差异,比如:

 

这称为“差分估计量”(difference estimator),即将处理组(treatment group)政策实施后的样本均值,减去政策实施前的样本均值。然而,由于宏观经济环境也随时间而变(时间效应),故政策实施地区的前后差异未必就是处理效应(treatment effects)。




双重差分法的反事实逻辑

为了解决差分法的局限性,常用方法是寻找适当的控制组(control group),即未实施政策的地区(或未参加项目的个体),作为处理组的反事实(counterfactual)参照系。具体来说,可将未受政策影响的控制组之前后变化视为纯粹的时间效应,即:

综合以上两个差分,即将处理组的前后变化减去控制组的前后变化,可得到对于政策处理效应更为可靠的估计:

            (1)

这就是所谓的双重差分估计量(Difference in Differences,简记DD或DID),因为它是处理组差分与控制组差分之差。该法最早由 Ashenfelter(1978)引入经济学,而国内最早的应用或为周黎安、陈烨(2005)。
从以上推理可知,DID的反事实逻辑能够成立,其基本前提是,处理组如果未受到政策干预,其时间效应或趋势应与控制组一样(故可以后者来控制时间效应),这就是所谓的 “平行趋势”(parallel trend)或 “共同趋势”(common trend)假定。下图直观地展示了DID的思想与平行趋势假定。

其中,t = 1 表示政策实施前(before),而 t = 2 表示政策实施后(after)。然而,通过双重差分得到的DID估计量并不易计算其标准误,无法加入控制变量,也不易推广到多期数据。故在实践中,一般通过回归的方法来得到DID估计量。




双重差分法的回归模型

考虑以下面板模型:

     (2)

其中,Gi 为分组虚拟变量(处理组=1,控制组=0),表示处理组与控制组的固有差异(无论是否实施政策都存在);Dt 为分期虚拟变量(政策实施后=1,政策实施前=0,允许使用多期数据),表示政策实施前后的时间效应(即使不实施政策也存在);而交互项 Gi · Dt  才真正表示处理组在政策实施后的效应,即处理效应。这是因为,处理组在政策干预之后的期望值为: 

而处理组在政策干预之前的期望值为:

故处理组期望值的前后变化为:

     (3)

另一方面,控制组在政策干预之后的期望值为:

而控制组在政策干预之前的期望值为:

故控制组期望值的前后变化为:

     (4)

将(3)式减去(4)式可知,双重差分的结果正好是回归方程(2)中交互项Gi · Dt  之系数 β。进一步可以证明,用OLS估计面板模型(2),所得交互项 Gi · Dt  之系数 β 的估计值,正好等于双重差分法(1)的计算结果(陈强,2014,第335、339页)。




一般的双重差分回归

更一般地,可在面板模型中加入个体固定效应、时间固定效应,以及其它控制变量:

      (5)

其中,ui 为个体固定效应(取代了更为粗糙的分组虚拟变量 Gi ,若同时二者包括将导致严格多重共线性),λt 为时间固定效应(取代了更为粗糙的分期虚拟变量 Dt ,若同时包括二者将导致严格多重共线性),zit 为一系列控制变量(影响结果变量 y 的其它因素),而 εit 为暂时性冲击(transitory shock)。
不难看出,上式其实就是 “双向固定效应模型”(two-way fixed effects),因为它既包括个体固定效应(ui ),也包括时间固定效应(λt );只不过多了双重差分法的关键变量,即交互项 Gi · Dt (也称为 “政策虚拟变量”,policy dummy)。在具体回归中,个体固定效应 ui 可通过加入个体虚拟变量来实现(即LSDV法,或进行组内离差变换,within transformation);而时间效应 λt 可通过加入每期的时间虚拟变量(time dummies)来实现。




双重差分法的假定

为了使用OLS一致地估计方程(5),需要作以下两个假定:

假定1 此模型设定正确。特别地,无论处理组还是控制组,其时间趋势项都是 λt。此假定即上文的 “平行趋势假定”(parallel trend assumption)。此假定比较隐蔽(有人称为 “hidden assumption”),因为只要写下方程(5),就已默认了平行趋势假定。
假定2 暂时性冲击 εit 与政策虚拟变量 Gi · Dt 不相关。这是保证双向固定效应为一致估计量(consistent estimator)的重要条件。
在此,可以允许个体固定效应 ui 与政策虚拟变量 Gi · Dt  相关(可通过双重差分或组内变换消去 ui ,或通过LSDV法控制 ui )。DID允许根据个体特征(ui )进行选择,只要此特征不随时间而变;这是DID的最大优点,即可以部分地缓解因 “选择偏差”(selection bias)而导致的内生性(endogeneity)。
如果违背假定1(平行趋势假定),会有什么后果?假设真实模型为:

则处理组(Gi =1)的时间趋势为 (λt + ηt ),而控制组(Gi =0)的时间趋势为 λt,故为非平行趋势。如果将此模型误设为平行趋势,则实际估计的模型为:

其中,Gi ηt 被纳入扰动项中,导致扰动项 (Gi ηt + εit )与政策虚拟变量(Gi · Dt  )相关,使得OLS不一致,也违背了上述假定2。




阿森费尔特沉降(Ashenfelter’s dip)

在使用个体或企业层面的微观数据时,有些人认为因个体无法影响宏观政策(或培训项目)的推出,故为外生。但事实上,个体依然可以自我选择是否参加项目,从而导致内生性。

比如,Ashenfelter (1978) 在研究就业培训的效应时发现,参加就业培训者在参加培训之年 (1964) 以及之前的那年 (1963),其平均收入不仅相对于控制组下降,而且绝对地下降,称为 “阿森费尔特沉降”(Ashenfelter’s dip),参见下图:

在上图中,实线为参加项目者的平均收入,而虚线为未参加项目者的平均收入(二者均为男性白人,该现象也存在于女性白人、男性黑人、女性黑人,在此从略)。上图表明,在1963年与1964年收入下降的不走运者(εit 为很大的负向冲击),很多人自我选择参加就业培训。
如果因为 εit  εi,t-1 特别低而参加培训,则通常 εi,t+1εi,t+2 会恢复到正常值,导致高估培训项目的效应。而 {εit } 也可能存在自相关。这使得暂时性冲击 εit 与政策虚拟变量 Gi · Dt 相关,导致不一致的估计(也意味着非平行的时间趋势,违背假定1,参见上图)。





非平行趋势的检验与处理方法

方法一 画时间趋势图

如果在政策干预前有多期数据,则可分别画处理组与控制组的时间趋势图(类似于上图),并直观判断这两组的时间趋势是否平行(比如,考察是否存在Ashenfelter's dip)。如果二者大致平行,则可增强对平行趋势假定的信心。然而,即使在政策干预前两组的时间趋势相同,也无法保证二者在干预后的时间趋势也相同(后者本质上不可观测,因为时间效应已与处理效应混合在一起)。另外,如果只有两期数据,则无法使用此法。

方法二 加入更多的控制变量

从上文的讨论可知,非平行趋势可能由于遗漏变量所导致,故在 zit 中加入更多控制变量,或可缓解内生性。但此法在实践中不易实施。

方法三 假设线性时间趋势

如果假设时间趋势为线性函数,则可加入每位个体的时间趋势项:

在具体回归时,加入个体虚拟变量与时间趋势项 t = 1, 2, ... , T 的交互项即可。然而,线性时间趋势毕竟是较强的假定,不一定能成立。故此法也不完全解决问题,但可作为稳健性检验。

方法四 三重差分法

在一定条件下,可通过引入两个控制组,进行三次差分,称为“三重差分法”(difference-in-differences-in-differences,简记DDD),这样可以更好地控制时间趋势的差异,使得平行趋势假定更易成立。有关DDD的进一步介绍,参见陈强(2014,第343页)。

___________________________________

参考文献

Ashenfelter, Orley,1978. “Estimating the Effect of Training Programs on Earnings.” Review of Economics and Statistics, 60(1), 47-57. 

Angrist, Joshua and Jorn-Steffen Pischke, 2015. Mastering 'Metrics. Princeton University Press, Princeton and Oxford. 

Imbens, Guido W.  and Jeffrey M. Wooldridge, 2009. "Recent Developments in the Econometrics of Program Evaluation," Journal of Economic Literature, 47(1), 5-86.

陈强,《高级计量经济学及Stata应用》,第2版,高等教育出版社,2014年。

周黎安、陈烨,《中国农村税费改革的政策效果:基于双重差分模型的估计》, 《经济研究》,2005年第8期。













►一周热文

统计计量丨一文读懂11个常见的多变量分析方法

数据呈现丨Pandas可视化综合指南:手把手从零教你绘制数据图表

统计计量丨计量经济学中的“条件”与“无条件”

老姚专栏丨与标准误有关的那些事

统计计量丨Back to Basics: OLS与内生性

数据呈现丨R语言可视化学习笔记之ggridges包

统计计量丨To Take Log, or Not to Take Log (取对数,还是不取对数)













数据Seminar

这里是大数据、分析技术与学术研究的三叉路口


作者:陈强出处:计量经济学及Stata应用推荐:简华(何年华)编辑:青酱






    欢迎扫描👇二维码添加关注    


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存