查看原文
其他

DIDM:多期多个体倍分法(案例及代码)

连享会 社科学术汇 2022-06-09

来源:stata连享会

作者:宋燕欣 (中山大学)

邮箱:songyx6@mail2.sysu.edu.cn


目录

  • 1. 引言

  • 2. 模型介绍

    • 2.1 传统DID模型

    • 2.2 多期 DID 模型

    • 2.3 多期多个体 DIDM 模型

  • 3. Stata 应用

    • 3.1 命令介绍

    • 3.2 论文示例

  • 4. 参考文献

  • 5. 相关推文

1. 引言

标准的双边固定效应 DID 模型研究的是两组样本在两个时期下二元处理的事件效果,而多期多个体倍分法 (DIDM) 是在标准 DID 模型下的扩展,研究多组样本在多个时间段非二元处理的事件效果。关于标准 DID 模型实现的相关推文已经很多,本文将主要介绍 DIDM 模型的估计命令 did_multiplegt

2. 模型介绍

2.1 传统DID模型

在双向固定效应基础上,传统 DID 模型加入了两个虚拟变量,即处理组变量  (处理组为 1,控制组为 0) 和处理期变量  (受到处理的时间点为 1,其他时间为 0)。基本模型设定如下:

其中, 是因变量, 代表个体固定效应, 代表时间固定效应, 代表随时间和个体变化的控制变量, 为误差项。

2.2 多期 DID 模型

传统 DID 模型中只有两期数据,并且假设处理组中所有的样本受到处理是同时的,这个设定在实际的研究中有较大的限制。例如,不同地区的政策出台时间不同,此时传统的 DID 模型就不适用了。多期的 DID 模型解决了处理时间点不同的问题,模型设定为:

与传统 DID 模型的唯一不同是变量  的设定。具体来看,在传统 DID 中,变量  只受时间 的影响,而在多期 DID 中,变量  同时受个体  和时间  的影响。

2.3 多期多个体 DIDM 模型

双边固定效应多期 DID 模型假设对于样本的处理是不变的,这样的假设在现实中常常不成立。首先,处理变量可能不是一个二元变量,如不同地区的政策力度不同。其次,处理也并非是一次性的,样本不能简单地一分为二处理组和控制组,如降雨对于地区的影响,会出现从有到无、从无到有的多个交替过程,这时就需要一个动态的处理组。

动态处理组的设定放松了传统 DID 模型中处理不变的设定,可以有效解决了上述的问题。并且,在模型中处理变量  可以为二元变量,也可以是非二元变量,本文以二元变量为例。

固定效应 (Fixed Effect)

固定效应是设定组间固定效应和时间固定效应的 OLS 回归,有:


其中,

 代表在  组  时的平均处理量, 代表不受政策处理的组平均结果, 则是受到政策处理的组平均结果。

固定效应的系数估计也可以理解为 ATE ( Average Treatment Effects ) 的加权平均,它的估计可以由两步得到。第一步是个体固定效应和时间固定效应对处理变量  的回归,可以理解为去掉了政策效果中时间和个体的特征,得到权重 。第二步得到  的估计 。

需要注意的是,权重允许为负数,这是因为在模型中,“控制组” 有时是所有时间段中都没有受到政策影响的样本,有时则是指两个时间点都受到处理的组,这两种更贴切的名称是稳定组 (stable)。那么对于两个时间点都受到处理的组,在第二个时间点上的权重是负数,但如果负权重太大,估计值是否会出现负数呢?尤其是模型中的时间、组数太多的情形,出现较大负权重的概率更大,最终的固定效应估计值就会出现负数。

为此,De Chaisemartin 和 d'Haultfoeuille (2020) 列举了一个简单的例子,具体如下:

设定两组实验组,在  时,两组都不受处理;在  时,A 组受处理,B 组不受处理;在  时,两组都受到处理。此时,A 组在两期的权重分别是 1/3,-1/6,B 组在第二期的权重为 1/6。双边固定效应的表达式是 ,如果  特别大,就会出现负数结果,如  。

明明政策是正向的,但是估计出现负数。这是因为,在异质性问题上,不同组的共同趋势不同,该模型的负数权重可能带来偏误,即如果一个政策效果是正的,太多负数的权重可能会导致系数估计结果为负。

异质性检验

De Chaisemartin 和 d'Haultfoeuille (2020) 提供了两个检验异质性处理效应稳健性的方法:第一个是 ,系数估计值除以权重的标准差,如果接近 0,说明双边固定效应是不稳健的,容易导致系数估计的符号与实际相反。

第二个是 ,只考虑有权重为负数的情况,检验系数估计接近 0,说明双边固定效应是不稳健的。如果是  比较小, 的结果很大,但第二个检验仍能接近于 0,则能更好地检验异质性。

对于这个问题,提出了下文的估计方法:

转换效应 (Switching Effect)

为了解决上述的异质性问题,De Chaisemartin 和 d'Haultfoeuille (2020) 提出了新的估计量,即将政策处理从无到有、从有到无两个正负方向的效果进行加权平均,而将两期的处理不变 (如:两期都是 1 或两期都是 0) 的样本作为控制组。对比多期 DID 模型,仅考虑了政策从无到有的情况。

 指的是政策从 0 到 1 的平均结果减去稳定组 (两期都是 0) 的平均结果, 指的是稳定组 (两期都是 1) 的平均结果减去政策从 0 到 1 的平均结果。

共同趋势假定:稳定组组内共同趋势,即对于在  和  都无政策的组有共同趋势,而在  和  都有政策的组有共同趋势。这个设定比上面的设定要宽松,固定效应的模型要求不同组的共同趋势也相同。

安慰剂效应 (Placebo Test)

在 DID 模型估计中,常常用到安慰剂检验,证明政策的有效性。在  时期实施安慰剂检验,即在  期模拟  期的政策,对比  和  的因变量。

在 DIDM 模型中,对于  期政策为 1 的,找出  和  期政策都是 0 的样本,对比三期都是 0 的样本,比较两组的平均结果之差 。另外,对于  期政策为 0 的,找出   和  政策都是 1 的样本,对比三期政策都为 1 的样本,比较平均结果的差别 。因为  和  期实际上没有政策的变化,所以如果模型的设定符合,DID 应该接近于 0。

安慰剂 Wald-TC 估计量表达式:


3. Stata 应用

3.1 命令介绍

命令安装

ssc install did_multiplegt, replace

语法介绍

did_multiplegt Y G T D [if] [in] [, options]

其中,输入的变量定义如下:

  • Y 输入结果变量;
  • G 输入分组变量;
  • T 是时间变量;
  • D 是处理变量。

options 选项定义如下:

  • placebo(#):输入安慰剂效应的数量;
  • controls(varlist):加入控制变量;
  • breps(#):输入重抽样的次数,用以计算标准误。

报告的结果保存到 e() 中,具体如下:

  • e(effect_0):估计政策转换的效应;
  • e(N_effect_0):估计的样本数;
  • e(N_switchers_effect_0):估计中出现政策转换 (0 到 1、1 到 0) 的数量;
  • e(se_effect_0:当启用 breps() 时报告标准误;
  • e(placebo_i) 是在政策转换之前  期的安慰剂效应估计;
  • e(N_placebo_i) 是估计安慰剂用到的样本数;
  • e(se_placebo_i) 是安慰剂效应的标准误。

3.2 论文示例

Vella 和 Verbeek (1998) 研究发现,工会工人的平均工资增长相比于非工会工人高 20% 左右。在本文中,我们使用这篇论文相同的面板数据估计工会对于工资的影响。首先使用 twowayfeweights估计双边固定效应的系数,检验异质处理的稳健性,再使用 did_multiplegt 命令估计状态转换 (switchers) 的平均处理效应。

. *下载数据
. ssc install bcuse, replace
checking bcuse consistency and verifying not already installed...
all files already exist and are up to date.

. bcuse wagepan

. *数据的基本统计情况
. sum lwage nr year union

Variable | Obs Mean Std. Dev. Min Max
-------------+---------------------------------------------------------
lwage | 4,360 1.649147 .5326094 -3.579079 4.05186
nr | 4,360 5262.059 3496.15 13 12548
year | 4,360 1983.5 2.291551 1980 1987
union | 4,360 .2440367 .4295639 0 1

其中,结果变量 lwage 是工资对数,分组变量 nr 相当于每一个人的 ID,时间变量 year 是 1980-1987 年,处理变量 union 是二元变量,并且 1 表示属于工会,0 表示不属于工会。

. *固定效应估计和检验
. ssc install twowayfeweights, replace
checking twowayfeweights consistency and verifying not already installed...
all files already exist and are up to date.

. twowayfeweights lwage nr year union, type(feTR)
Under the common trends assumption, beta estimates a weighted sum of 1064 ATTs. 
860 ATTs receive a positive weight, and 204 receive a negative weight.
The sum of the positive weights is equal to 1.0054686.
The sum of the negative weights is equal to -.00546854.
beta is compatible with a DGP where the average of those ATTs is equal to 0,
while their standard deviation is equal to .09357625.
beta is compatible with a DGP where those ATTs all are of a different sign than beta,
while their standard deviation is equal to 5.389153.

固定效应估计中,有 860 个正权重,204 个负权重,两个检验发现系数估计在异质处理下接近于 0,是不稳健的。因此,我们使用 DIDM 模型 did_multiplegt 进一步观察工会对于工人工资的影响。

. *模型估计
. did_multiplegt lwage nr year union, placebo(1) breps(50) cluster(nr)

DID estimators of the instantaneous treatment effect, of dynamic treatment effects if the dynamic option is used, and of placebo tests
of the parallel trends assumption if the placebo option is used. The estimators are robust to heterogeneous effects, and to dynamic
effects if the robust_dynamic option is used.

| Estimate SE LB CI UB CI N Switchers
-------------+------------------------------------------------------------------
Effect_0 | .0261226 .0194753 -.0120489 .0642941 3815 508
Placebo_1 | .0993211 .0315587 .0374661 .1611761 2842 247

. *显示结果
. ereturn list

scalars:
e(effect_0) = .0261225951945861
e(se_effect_0) = .0194752588662298
e(N_effect_0) = 3815
e(N_switchers_effec
t_0) = 508
e(placebo_1) = .0993211109434541
e(se_placebo_1) = .0315586535625052
e(N_placebo_1) = 2842
e(N_switchers_place
bo_1) = 247

当命令启用了重抽样后,结果会返回一幅包含估计值、安慰剂效应、以及 95% 置信区间图,具体如下所示:

结果显示,工会的作用效果为 0.026,即加入工会能够提高工资 2.6%,此结果与原论文的估计 20% 差异较大,说明异质性处理确实影响了系数的估计。在安慰剂效应中估计值为 0.099,拒接安慰剂估计为 0 的假设,说明模型可能不符合共同趋势的设定。再来看时间处理前后 5 期的效果,具体如下所示:

. did_multiplegt lwage nr year union, placebo(5) breps(50) cluster(nr) dynamic(5)

可以看出,加入工会在 0-3 期的作用持续上升,到第 4 期回到 0 的水平上。在 t = 0 之前的安慰剂检验波动较大,再次说明模型可能不符合共同趋势的设定。

4. 参考文献

  • De Chaisemartin C, d'Haultfoeuille X. Two-way fixed effects estimators with heterogeneous treatment effects[J]. American Economic Review, 2020, 110(9): 2964-96. -PDF-
  • Vella F, Verbeek M. Whose wages do unions raise? A dynamic model of unionism and wage rate determination for young men[J]. Journal of Applied Econometrics, 1998, 13(2): 163-183. -PDF-

您可能也对以下帖子感兴趣

【中医】针灸与非手术治疗足底筋膜炎的疗效比较:网络荟萃分析
第二章 拓展阅读 精神科诊断中的心理学效应
子女教育专项附加扣除对家庭教育支出的影响研究
增值税留抵退税对企业投资的激励效应研究
公共数据开放对城乡居民收入增长的积极影响

文章有问题?点此查看未经处理的缓存