凡是搞计量经济的,都关注这个号了
稿件:econometrics666@126.com
所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.
关于DID,参看:1.120篇DID双重差分方法的文章合集, 包括代码,程序及解读, 建议收藏!2.诚实双重差分法DID, 面板事件研究法和Bacon分解的经典应用文!3.前沿: 多期或渐进或交叠DID, 如何进行平行趋势检验呢?4.多期DID或渐进DID或交叠DID, 最新Stata执行命令整理如下供大家学习,5.DID前沿: 5种方法估计事件研究的因果效应, 并使用绘制系数和置信区间, 详细代码和数据,6.事件研究法开展政策评估和因果识别, 分享8篇提供数据和代码的文章,7.推荐用渐进(多期)DID和事件研究法开展政策评估的论文及其实现数据和代码!8.机器学习已经与政策评估方法, 例如事件研究法结合起来识别政策因果效应了!
关于下方文字内容,作者:1.alphabeta群友,计量社群;2.钟秉睿,中央财经大学财政税务学院,通信邮箱:zunity@163.com
本文旨在介绍一种DID的前沿方法——模糊DID(Fuzzy Differences-in-Differences),该方法由de Chaisemartin和D’Haultfœuille(2017)在刊于Review of Economic Studies(经济学界TOP5期刊之一)的Fuzzy Differences-in-Differences(下称“文章”)中系统概述。尽管DID方法被学界广泛使用,但不可否认的是,不少DID设计的科学性和估计的准确性仍待商榷,模糊DID就是一个例子。de Chaisemartin & D’Haultfœuille (2016)指出,AER在2010至2012年刊发的所有文章中,至少10.1%应用了这种方法。(众所周知,AER上的文章以新奇的研究视角和真实而独特的数据集著称,这一证据充分显示出了Fuzzy DID在解释现实问题上的重要性和开拓性)然而,模糊DID的理论却缺乏系统的梳理——文章有言:“据我们所知,还没有论文研究模糊DID设计中的处理效应识别和评估。”所谓模糊DID适用于这样一种情况:研究者并不能找到满足标准DID设定的对照组或实验组,即要么找不到在观测期内从未接受处理的“对照组”(没有任何一组完全未受到政策干预),要么找不到在政策执行后从未接受处理的组别直接变为完全接受处理的“实验组”(没有任何一组在政策执行后显示出了sharp变化)。换言之,即处理组和对照组之间只存在处理率的差别(处理组的处理率经过选定的处理期后远高于对照组),不存在“0”与“1”的界限。依照标准DID方法,这种情况明显难以下手,但现实中大量的数据集都只能符合这种情况,怎么办?
“车到山前必有路”,过往的研究者普遍采用Wald-DID估计量来估计这种情况下的处理效应,定义Wald-DID:
其中,表示观测到的结果(因变量)的DID,表示处理的DID。直观而言,Wald-DID体现了这样一种思想:既然不存在对照组,难以求出整体的平均处理效应(ATE),那么我们可以利用那些处理组的“switchers”(在下一期由未处理转变为已处理的个体)来估计出局部平均处理效应(LATE),这样依然可以体现政策的作用。文章关于处理效应的讨论自Wald-DID估计量展开,指出当且仅当处理效应不随时间变化、处理组和对照组接受的处理同质时,Wald-DID估计量才能确定LATE。进一步地,文章提出了两种可以用于替代(改进)Wald-DID的估计量——Wald-TC和Wald-CIC,它们都能够在不满足处理组和对照组所受处理同质性的条件下估计出LATE,且是渐进有效的。
上表是本文进行的一些基础定义。此外,文章提出了3个初步假设以备讨论,分别是模糊设定、对照组中受处理个体占比不变、个体参与处理符合方程:
即为我们关注的局部平均处理效应(LATE),即为局部分位数处理效应(LQTE)。可见,LATE考察的是处理组中从未接受处理转变为已接受处理的“switchers”所接受的处理的潜在结果,与现有研究的思路一致;LQTE则是分位数回归关注的变量。本推文仅介绍估计量的形式及文章相关结论,其余不予赘述。
补充假设4、5、6,分别为(绝对)共同趋势、处理效果不随时间变化、各组处理效果同质假设,如下:
文章指出,Wald-DID估计量在满足:模糊设定、个体参与处理符合前述方程、共同趋势、处理效果不随时间变化的假设(即假设1、3、4、5)时,有:
也即Wald-DID等于0至1期时段(0、1两期的情况下)中处理组和对照组“switcher”个体差分的加权值。而观测到的因变量均值变化由三部分组成:0期时未处理个体不受处理的潜在结果Y(0)的均值变化、0期时受处理个体受处理的潜在结果Y(1)的均值变化、“switcher”的平均处理效应。Wald-DID在满足假设1、3、4、5的基础上,若能满足对照组中受处理个体占比不变或各组处理效果同质的假设(2或6),则有:
即此时的Wald-DID估计量能够准确估计出LATE。Wald-TC与Wald-DID估计量思想相似,是修正了时间的进阶版(The time-corrected Wald estimand),与Wald-DID不同的是,它不依赖于绝对共同趋势和处理效果不随时间变化的假设,而依赖于条件共同趋势假设:
其中,,表示:处理状态为d的对照组个体在0至1期内平均结果E(Y)的变化。文章指出,在满足模糊设定、对照组中受处理个体占比不变、个体参与处理符合前述方程 ,以及上述条件共同趋势假设的情况下(假设1、2、3、4’),有:。即修正时间后的Wald-DID将共同趋势假设条件放松了,并仍能准确估计出LATE。与Wald-TC相似,Wald-CIC也是在Wald-DID估计量基础上做的改进,但这一改进并非无本之木,是参照Athey & Imbens(2006)提出的Changes-in-Changes方法设计的。简单来说,CIC方法的特点是放弃了DID的共同趋势假设,而依赖于“共同变化”假设。它的好处是当观测结果发生比例缩放时仍然稳健,但它也对潜在结果的分布施加了限制,而共同趋势假设仅对均值有所限制。为了构造出Wald-CIC统计量,文章依照提出者的逻辑补充了假设7、8,分别是不可观测变量单调且不随时间改变、数据限制(对虚拟变量D、G、T的分布和相关的样本域提出限制),具体表述如下:
其中,,表示对照组中在D=d的条件下个体从0至1期的分位数-分位数变换(Quantile-Quantile Transform)。文章指出,在满足模糊设定、对照组中受处理个体占比不变、个体参与处理符合前述方程、不可观测变量单调且不随时间改变、数据限制假设(1、2、3、7、8)的条件下,有:
直觉来看,该定理说明了Wald-CIC在满足“共同变化”假设的条件下,也能准确估计出LATE。(但是从形式就可以看出来这种方法的假设和形式都比较复杂,并且需要至少三步估计,至于效果如何,下文会摘录文章的复现案例)在文章的补充材料中,作者给出了可用于实战估计的实际估计量形式:
虽然前述过程需要大量的数学推导和繁琐的定义,但作者为便于所有研究者使用,已经开发出了STATA Package,语法如下:
包含协变量条件下回归命令的设定,以及相关可选项此处不再赘述,可以在STATA中输入:help fuzzydid 命令查看完整语法在补充资料中,作者提供了fuzzydid命令的使用案例,使用Gentzkow et al. (2011)关于报纸对于选举参与影响的研究所形成的数据集,推文作者使用STATA15.1进行演示。webuse set www.stata-journal.com/software/sj19-2webuse st0560/turnout_dailies_1868-1928.dta, clear(该数据集较大,包含212个变量、16872个观测值,可能导入较慢,需要耐心等待)
本文的数据集是一个县域数据,因变量(Y)是pres_turnout,即各县的投票率,主要解释变量(D)是numdailies,即各县可获得的报纸种类数,时间跨度是1868-1928年,描述性统计如下(Code+结果):sum pres_turnout numdailies
定义虚拟变量G1872,等于1时表示1868和1872年竞选期间的4年内报纸种数增加了的县:gen G1872=(fd_numdailies>0) if (year==1872)&fd_numdailies!=.&fd_numdailies>=0 & sample==1replace G1872=G1872[n+1] if cnty90==cnty90[n+1]&year==1868进行回归,求出Wald-DID、Wald-TC、Wald-CIC估计量结果如下:fuzzydid pres_turnout G1872 year numdailies, did tc cic newcateg(0 1 2 45) breps(200) cluster(cnty90)可见,所有的估计值都是正的,与原文结果一致,但全都未通过显著性检验。出现这种现象的原因是,仅设置两期分组测LATE,可用样本量太小。这时就需要进一步对全体样本进行类似过程的Fuzzy-DID回归了。by cnty90 year: egen mean_D = mean(numdailies)by cnty90: g lag_mean_D = mean_D[n-1] if cnty90==cnty90[n-1]&year-4==year[_n-1]g G_T = sign(mean_D - lag_mean_D) if sample==1g G_Tplus1 = G_T[n+1] if cnty90==cnty90[n+1]&year+4==year[_n+1]进行回归(与之前一样设置了200次bootstrap,在11代i7CPU和8GRAM的条件下需要约3分钟):fuzzydid pres_turnout G_T G_Tplus1 year numdailies, did tc cic newcateg(0 1 2 45) breps(200) cluster(cnty90) eqtest可以发现,Wald-DID、Wald-TC、Wald-CIC统计量依然为正且取值并没有显著差别,但此次均在统计上显著,与原文结果实现了统一。以上理论推导和复现案例显示,文章提出的三种统计量在满足各自相应假设的前提下,可以用于模糊DID的估计,并能够互相替代。更多具体的应用场景,还等待各位研究者躬身发掘。
关于DID,参看:1.120篇DID双重差分方法的文章合集, 包括代码,程序及解读, 建议收藏!2.诚实双重差分法DID, 面板事件研究法和Bacon分解的经典应用文!3.前沿: 多期或渐进或交叠DID, 如何进行平行趋势检验呢?4.多期DID或渐进DID或交叠DID, 最新Stata执行命令整理如下供大家学习,5.DID前沿: 5种方法估计事件研究的因果效应, 并使用绘制系数和置信区间, 详细代码和数据,6.事件研究法开展政策评估和因果识别, 分享8篇提供数据和代码的文章,7.推荐用渐进(多期)DID和事件研究法开展政策评估的论文及其实现数据和代码!8.机器学习已经与政策评估方法, 例如事件研究法结合起来识别政策因果效应了!9.多期DID前沿方法大讨论, e.g., 进入-退出型DID, 异质性和动态性处理效应DID, 基期选择问题等,10.面板数据政策评估方法(DID等)的最新进展与相关应用, 包括机器学习和因子估计法,11.AEJ上首篇用DID研究晚清电报与粮食价格关系的量化史文章! 通电报, 粮价稳!12.前沿, 合成双重差分法SDID方法介绍和示例, 附code和数据!
下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。