Stata18.0新版本异质性DID操作手册:hdidregress与xthdidregress
Stata18.0新版本异质性DID操作手册:hdidregress与xthdidregress
估计 队列和时间的异质性 面板数据 重复的横截面数据 四个估算器 回归调整 (RA) 逆概率加权 (IPW) 增强型逆概率加权 (AIPW) 双向固定效应回归 (TWFE) 治疗效应异质性图 平行预处理趋势测试 ATET 的聚合: 队列 时间 暴露于治疗 同步置信区间
当平均治疗效果随时间和队列而变化时,您现在可以使用 新的 HDIDREGRESS 和 Xthdidregress 命令来估计 异质平均治疗对治疗的影响(ATETs)。对重复的横截面数据使用 hdidregress,对面板数据使用 xthdidregress。从四个估算器中选择一种, 包括回归调整和逆概率加权。
治疗效果衡量治疗对结果的因果效应。一个 治疗是新的药物治疗方案、外科手术、培训计划或 即使是旨在影响血压等结果的广告活动, 流动性、就业或销售。估计 ATET 很有趣。
标准差分 (DID) 估计器,在现有 命令 didregress 和 xtdidregress,估计 ATET 是 跨时间所有组通用。当在不同点治疗组时 随着时间的推移,可能会违反关于恒定 ATET 的假设。新的 命令实现估计方法,这些方法考虑了 ATET 并提供特定于队列和特定时间的 ATET 估计值。
让我们看看它的工作原理
我们想知道学区级别的计划“健康习惯”是否会降低学区学生的体重指数(BMI)。我们有关于健康习惯计划的虚构数据。该计划包含更多的锻炼时间,并增加水果和蔬菜的摄入量。我们的数据是学区级别的,包括有关学校是否参与该计划的信息,hhabit以及学区学生的BMI,bmi。从 11 年到 14 年,我们对来自 40 个学区的 2013 至 2021 岁学生进行了重复抽样调查。
对于结果模型,我们认为母亲的教育medu是儿童健康习惯的良好预测指标。我们还认为,参与体育运动会影响****BMI。最后,我们控制学生是否是女孩,以解释这个年龄段男孩和女孩的行为差异和体型差异。
对于处理模型,我们使用该地区的公园数量(parksd)来模拟hhabit。我们推测,拥有更多公园的学区认为运动空间在其城市规划中比公园较少的学区更重要。因此,这些地区更适合健康习惯计划。
我们使用aipw估计器来模拟结果和治疗。aipw 估计器具有双重稳健性属性,这意味着只需要正确指定一个结果模型或处理模型即可获得一致的估计值。
我们适合以下模型:
. hdidregress aipw (bmi medu i.girl i.sports) (hhabit parksd), group(schools) time(year)
note: variable _did_cohort, containing cohort indicators formed by treatment variable hhabit and
group variable schools, was added to the dataset.
Computing ATET for each cohort and time:
Cohort 2015 (8): ........ done
Cohort 2017 (8): ........ done
Cohort 2019 (8): ........ done
Treatment and time information
Time variable: year
Time interval: 2013 to 2021
Control: _did_cohort = 0
Treatment: _did_cohort > 0
_did_cohort
Number of cohorts 4
Number of obs
Never treated 11355
2015 1231
2017 2097
2019 2042
Heterogeneous treatment-effects regression Number of obs = 16,725
Estimator: Augmented IPW
Treatment level: schools
Control group: Never treated
(Std. err. adjusted for 40 clusters in schools)
Robust
Cohort ATET std. err. z P>|z| [95% conf. interval]
2015
year
2014 .6544681 .5946048 1.10 0.271 -.5109359 1.819872
2015 -1.226451 .379168 -3.23 0.001 -1.969607 -.4832957
2016 -2.491842 .4169657 -5.98 0.000 -3.30908 -1.674605
2017 -2.72486 .2363878 -11.53 0.000 -3.188171 -2.261548
2018 -2.786634 .6672867 -4.18 0.000 -4.094492 -1.478776
2019 -3.980456 .2993279 -13.30 0.000 -4.567127 -3.393784
2020 -.604415 .5929199 -1.02 0.308 -1.766517 .5576866
2021 -.6522272 .3640416 -1.79 0.073 -1.365736 .0612812
2017
year
2014 .6635794 .3089663 2.15 0.032 .0580167 1.269142
2015 -1.3933 .3871204 -3.60 0.000 -2.152042 -.6345582
2016 .5947865 .4065947 1.46 0.144 -.2021245 1.391697
2017 -1.71427 .4565384 -3.75 0.000 -2.609069 -.8194714
2018 -3.170542 .5221368 -6.07 0.000 -4.193912 -2.147173
2019 -2.967701 .4247053 -6.99 0.000 -3.800108 -2.135294
2020 .0360098 .6868764 0.05 0.958 -1.310243 1.382263
2021 -.957117 .3510986 -2.73 0.006 -1.645258 -.2689763
2019
year
2014 -1.434451 .5163232 -2.78 0.005 -2.446426 -.422476
2015 1.010288 .4808165 2.10 0.036 .067905 1.952671
2016 -.3809733 .4336764 -0.88 0.380 -1.230963 .4690169
2017 .5199519 .4849723 1.07 0.284 -.4305763 1.47048
2018 -.0315794 .5863875 -0.05 0.957 -1.180878 1.117719
2019 -3.602114 .3498692 -10.30 0.000 -4.287845 -2.916383
2020 -1.388906 .6765493 -2.05 0.040 -2.714919 -.0628943
2021 -.6222491 .5510466 -1.13 0.259 -1.70228 .4577824
Note: ATET computed using covariates.
我们在第一组括号中指定了结果模型,在第二组括号中指定了治疗模型。我们还指定了选项组(学校)来定义治疗发生在学校层面,并将学校确定为聚类变量。最后,我们在选项 time() 中指定了一个时间变量年份。
命令下方的注释指示分类变量**_did_cohort是使用同期群信息生成的。同一队列中的单位同时开始治疗。我们看到我们的数据中有三个队列:2015 年、2017 年和 2019 年。此外,我们看到 11,355 个观测值从未得到处理。时间可变年份**的范围从 2013 年到 2021 年。
估计表报告了每年每个队列的 ATET。例如,对于 2015 年的 2016 年队列,ATET 估计值为 -2.5,这意味着健康习惯计划平均将 2 年队列中某个地区的学生的 BMI 降低 5.2015 相对于该学区不参与的情况。其他估计可以简单地解释。
仅通过查看所有 ATET 估计值很难看到 ATET 的趋势。我们可以使用estat atetplot来可视化每个队列的ATET的时间概况。我们指定选项 sci 以显示同时置信带,保证以预定义的概率水平覆盖所有队列和时间的 ATET 真实值。
. estat atetplot, sci
拟合模型后,我们可以使用 estat aggregation 来聚合队列、时间和治疗暴露范围内的 ATET。它提供了 ATET 不同方面的摘要。例如,我们使用estat aggregation, cohort 来总结时间内每个队列的 ATET。我们还指定选项图,以获取除表格输出之外的聚合图。
最后,如果我们想总结不同治疗暴露时间的 ATET,我们指定选项dynamic。