didplacebo:DID安慰剂检验的Stata新命令(中)
高级计量之Stata因果推断四天现场班
陈强 亲授
北京, 2023年10月1-2日, 3-4日
Now or Never!
(详情点击页底“阅读原文”)
接上期推文:didplacebo:DID安慰剂检验的Stata新命令(上)
四、交叠DID的安慰剂检验案例:TWFE
下面以美国银行放松管制影响收入分配的案例(Beck et al., 2010),使用本团队开发的Stata命令didplacebo(陈强、齐霁、颜冠鹏, 2023),演示交叠DID的安慰剂检验操作。
陈强、齐霁、颜冠鹏(通讯作者),“双重差分法的安慰剂检验:一个实践的指南”,2023年,山东大学工作论文
Beck, Thorsten, Ross Levine, and Alexey Levkov. "Big bad banks? The winners and losers from bank deregulation in the United States." Journal of Finance 65.5 (2010): 1637-1667.
从20世纪70年代至90年代,美国大多数州逐渐取消了在州内开设银行分支机构(intrastate branching)的限制,使得银行竞争加剧,并提升了银行业绩。Beck et al.(2010)使用1976-2006年美国48个州和哥伦比亚特区的面板数据,进行交叠DID估计(因为各州放松管制的时间不同),结果显示放松银行管制显著改善了收入不平等。考虑以下交叠DID的双向固定效应(TWFE)模型:
其中,被解释变量为基尼系数的对数;
在交叠DID的场景下,如果处理效应不随时间而变,则传统的双向固定效应估计量(TWFE)仍是一致估计。故本期推文仍以TWFE进行演示。当然,若处理效应随时间而变,则应使用异质性稳健的估计量,比如CSDID,详见下期推文。加载数据集bbb.dta,并设为面板数据集:
. sysuse bbb.dta, clear
. xtset statefip wrkyr
其中,“statefip”表示州,而“wrkyr”表示年。由于数据集中的协变量名称较繁琐,故通过命令global设定“全局暂元”(global macro),并以cov作为所有协变量的简写:
. global cov gsp_pc_growth prop_blacks prop_dropouts
prop_female_headed unemploymentrate
如此定义之后,在后续命令中,只要用“$cov”即可指代所有协变量。接着,进行双向固定效应估计:
. xtreg log_gini _intra $cov i.wrkyr, fe r
其中,“i.wrkyr”为时间虚拟变量,选择项“fe”指定固定效应模型,而选择项“r”指定使用聚类稳健标准误。估计结果如下:
上表显示,双向固定效应估计值为-0.018,且在1%水平上显著,说明放松银行管制可降低基尼系数,改善收入不平等。将回归结果存为“did_bbb”,以便后续调用:
. estimates store did_bbb
下面进行时间安慰剂检验,将银行放松管制时间分别前置1至10年,作为“伪处理时间”,进行DID估计:
. didplacebo did_bbb, treatvar(_intra) pbotime(1(1)10)
其中,必选项“treatvar(_intra)”指定处理变量为_intra;而选择项“pbotime(1(1)10)”表示,将处理时间分别前置1至10期,进行时间安慰剂检验。
上表汇报了处理时间前置1至10期的安慰剂检验结果。结果显示,大多数的安慰剂效应都不显著。然而,若将银行放松管制时间前置2或3年,其安慰剂效应均在5%水平上显著为正,说明银行放松管制可能存在前置2至3年的预期效应。
更直观地,此命令还画了时间安慰剂效应的95%置信区间。其中,前置2期与3期的安慰剂效应置信区间均在横轴上方(未包括0),故这两期的安慰剂效应显著为正;而其余各期的安慰剂效应则不显著。
下面进行空间安慰剂检验,在保持处理时间与组群结构不变的情况下,随机置换个体的组群归属,进行双向固定效应估计(TWFE),并重复500次,得到安慰剂效应的分布:
. didplacebo did_bbb, treatvar(_intra) pbounit rep(500) seed(1)
其中,选择项“pbounit”表示进行空间安慰剂检验,选择项“rep(500)”表示重复500次(这是默认选项,故可省略),而选择项“seed(1)”指定随机种子为1(这是默认选项,故可省略;使用相同随机种子可保证结果可复现)。所得结果如下:
上表汇报了空间安慰剂检验的双边、左边和右边p值。其中,双边p值为0.012(在5%水平上显著),而左边p值为0.006(在1%水平上显著),故可拒绝“处理效应为0”的原假设。更直观地,此命令还画了安慰剂效应的核密度图与直方图,表明处理效应估计值(图中垂直实线)位于安慰剂效应分布的左侧尾部,故为极端值(若处理效应为0,则不应在一次抽样中看到)。
下面进行无约束(unrestricted)的混合安慰剂检验,同时使用伪处理个体与伪处理时间。具体而言,根据样本中放松管制的最早与最晚时间,从该区间的均匀分布中随机抽取每个州的伪处理时间,进行TWFE估计,并重复500次,得到安慰剂效应的分布:
. didplacebo did_bbb, treatvar(_intra) pbomix(2)
其中,选择项“pbomix(2)”表示以无约束(unrestricted)的方式(version 2),进行适合于交叠DID的混合安慰剂检验,所得结果如下:
上表汇报了混合安慰剂检验的双边、左边和右边p值。其中,双边p值和左边p值均为0.000,故可强烈拒绝“处理效应为0”的原假设。更直观的,此命令还画了安慰剂效应的核密度图与直方图,其中处理效应估计值(图中垂直实线)位于安慰剂效应分布的最左侧,故为异常极端值。
显然,在进行无约束的混合安慰剂检验时,无法保持交叠DID原有的组群结构(即每个组群内有多少个体)。为此,下面进行有约束(restricted)的混合安慰剂检验,可保持交叠DID的组群结构(即每个组群内的个体数目与原始样本相同):
. didplacebo did_bbb, treatvar(_intra) pbomix(3)
其中,选择项“pbomix(3)”表示针对交叠DID模型,进行有约束的混合安慰剂检验(version 3),以保持组群结构。
上表汇报了混合安慰剂检验的双边、左边和右边p值。其中,双边p值和左边p值分别为0.008和0.004,故可强烈拒绝“处理效应为0”的原假设。更直观地,此命令还画安慰剂效应的核密度图与直方图,其中处理效应估计值(图中垂直实线)位于安慰剂效应分布的左侧尾部,故为异常极端值。
然而,若处理效应随时间而变,则以TWFE估计交叠DID模型将带来偏差。但由于异质性稳健的交叠DID方法有多种,故不便整合进命令didplacebo中。尽管如此,交叠DID安慰剂检验的原理仍基本相同,只是将TWFE估计量替换为异质性稳健的交叠DID估计方法。作为例子,下期推文将使用异质性稳健的CSDID(Callaway and Sant’Anna, 2021),进一步演示交叠DID的安慰剂检验,敬请期待。
参考文献
陈强,《高级计量经济学及Stata应用》,第2版,高等教育出版社,2014年(配套四天现场班,详情见页底“阅读原文”)
陈强,《计量经济学及Stata应用》,高等教育出版社,2015年(好评如潮的配套教学视频,可在 Peixun.net 或网易云课堂购买)
陈强,《机器学习及R应用》,高等教育出版社,2020年11月,472页,双色印刷
陈强,《机器学习及Python应用》,高等教育出版社,2021年3月,632页,双色印刷
(c) 2023, 陈强,山东大学经济学院
www.econometrics-stata.com
转载请注明作者与出处
Our mission is to make econometrics easy,
and facilitate convincing empirical works.