查看原文
其他

中断时间序列分析ITSA是什么? 很流行的政策评估新范式!

计量经济圈 计量经济圈 2022-05-11

凡是搞计量经济的,都关注这个号了

稿件:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

正文

关于下方文字内容,作者郭馨雨,北师大香港浸会联合国际学院通信邮箱:见留言区13014@qq.com

Linden, A. (2015). Conducting Interrupted Time-series Analysis for Single- and Multiple-group Comparisons. The Stata Journal, 15(2), 480–500. https://doi.org/10.1177/1536867X1501500208
In this article, I introduce the itsa command, which performs interrupted time-series analysis for single- and multiple-group comparisons. In an interrupted time-series analysis, an outcome variable is observed over multiple, equally spaced time periods before and after the introduction of an intervention that is expected to interrupt its level or trend. The itsa command estimates the effect of an intervention on an outcome variable either for a single treatment group or when compared with one or more control groups. Additionally, its options allow the user to control for autocorrelated disturbances and to estimate treatment effects over multiple periods.

简介

当研究一项大规模干预的影响时,相当普遍地,我们会面对样本量等于1的情况,即数据(如平均费用,发病率和死亡率)仅是在总体水平上报告的。在这种情况下,仅依靠感兴趣的变量在干预实施前后的一系列观测值,我们便可以利用时间序列的干预分析(interrupted time-series analysis, ITSA)将干预的实施视为准实验设计,并获得较高的内部效度。而当干预组的结果可以与控制组的结果相比较时,通过允许研究者控制遗漏变量的影响,内部效度可以进一步增强。
本文作者介绍了如何在STATA中得到ITSA估计。itsa是一条估计时间序列数据对干预反应的命令,它可以估计单组或多组比较情况下干预的处理效应。同时,在观测期内存在多项干预时,itsa命令也同样适用。

方法论

进行ITSA必不可少地要考虑到自相关性带来的影响,实践中两种常见的解决方法是ARIMA或OLS回归。STATA中的itsa命令依赖于OLS回归而不是ARIMA,因为与后者相较,OLS回归通常更灵活。itsa命令提供了newey和prais两种回归方法供选择,在后文中会有详细介绍。

单组干预分析

当只有一个研究对象(没有控制组)时,标准ITSA回归模型采用以下形式
如果随机误差项遵循AR(1)过程,则定义随机误差项如式2所示,其中1,服从正态分布(0,)。式2对于单组或多组ITSA均适用。
当选择ITSA时,我们必须清楚支持模型成立背后的假设。首先,当窗口期存在多项干预时,ITSA可能并不适用。其次,按照设计,单组ITSA没有可比的控制组,我们根据干预前的趋势预测到的值即为反事实结果。这需要我们作出假设:任何随时间变化的干扰因子都是缓慢而平稳变化的,因此其影响可以与干预所引起的急剧变化区分开来。
在这里,断点回归中的经验可以被用于检验ITSA模型的稳健性:将干预的真正起始点替换为非干预期中的一些伪起始点,之后再进行测试。Imbens & Lemieux (2008)对ITSA的研究发现,在一个足够长的时间序列中,非干预期的中间时间点是伪起始点的一个很好的选择。而对于较短的时间序列,我们可以使用一个简单的迭代过程来测试每个伪起始点的回归结果。在此类检验中,如果在伪起始点发现结果变量的水平或趋势存在中断,那么单组ITSA的基本假设就会受到挑战。

多组干预分析

当存在控制组进行比较时,多组ITSA回归模型为
当存在影响所有组的外生影响时,多组ITSA的方法可能具有特别价值。它的关键假设是,在干预组没有接受干预的反事实状态下,两组结果变量在水平或趋势上的变化应该是相等的。换句话说,我们假设遗漏的干扰因子对处理组和控制组的影响相当。多组ITSA的一个主要优势在于它能够根据协变量来判断两组之间的可比性(特别是衡量了两组在干预实施前水平和趋势差异的)。如果数据来自随机对照试验,我们预计在干预前两组会有相似的水平和斜率。然而在观测性研究中,组间的相似性并不能得到保证,任何差异都可能引起对因果推断可信度的怀疑。
为了减少这种威胁,研究人员试图模拟随机化过程。一种方法是使用式3将干预组与所有潜在的控制组分别进行分析,最终选出令不显著的样本作为对照。这种方法可以很容易地扩展到其他协变量,但随着协变量数量的增加,找到控制组的可能性会降低。当模型存在较多需要控制的协变量时,更好的方式是选择合成控制法或倾向得分匹配法。

数据

表1显示了在回归(1)和回归(3)中使用的变量。示例的样本有两个个体,每个个体有六个观测值。T项说明了观测的期数;X项表示在干预发生前有两期观测数据,发生后有四期;交互项XT从干预发生后的一期开始计数,并持续到最后。注意在计算该交互项时,我们将XT变形为XT=(T-3)*X,使它在干预发生后从1开始按顺序出现。在多组ITSA中,Z表示处理状态,处理组Z=1,控制组Z=0;ZTZXZXT均是上节定义的交互项。

模型

itsa允许使用者在两种专为时间序列数据设计的OLS回归模型之间进行选择。第一个是newey(命令均可参考help中的描述,下文同),它通过OLS回归估计系数,并产生Newey-West标准误来处理自相关及可能的异方差。第二个模型是prais,它使用广义最小二乘法来估计线性回归中的参数,其中误差项默认遵循AR(1)过程。
自相关滞后的期数对于模型的选择至关重要。一般情况下,研究者首先使用regress或newey在lag 0的情况下拟合OLS模型,然后检验误差项的自相关。该包提供了几个用于此目的的后续估计命令,见于[R] regress postestimation time series。此外,还有一个由用户编写的程序actest,可以从Statistical Software Components中下载,它默认的是Cumby-Huizinga自相关测试。

itsa命令

语法

在运行itsa命令前,单个面板的数据集必须使用tsset timevar设置为时间序列数据。当含有多个面板时,则必须使用tsset panelvar timevar来设置这个强平衡的面板数据集。

可选项

trperiod (numlist) 设置干预开始的时间。可以指定多个时间段。此选项是必须的。
single 表示将使用itsa进行单组干预分析。省略该选项则表示进行双组比较。
treatid (#) 当数据集包含多个面板时,指定所研究的单个处理组个体的标识符。当进行单组干预分析时,必须忽略此选项。
contid (numlist) 指定在多组分析中用作控制组个体的标识符列表。如果没有指定contid(),数据中所有未处理的个体都将被视为控制组。
prais 使用prais模型拟合。如果没有指定,itsa将默认使用newey回归模型。
lag (#) 选择newey模型后指定要考虑的最大滞后期数。如果指定滞后为0,输出的结果将与regress, vce(robust)相同。如果在选择了prais模型后指定lag()会出现错误信息,因为prais默认执行的是AR(1)过程。
figure 生成一个基于散点图的折线图。在多组分析中,则将控制组的观测值取平均后绘制。
posttrend 使用lincom模型生成后处理趋势的估计值。对于单组ITSA,产生一个估计值。在多组ITSA的情况下,则分别对处理组,控制组及两组的差异进行估计。在多个干预期的情况下,为每个干预期生成一个单独的表。
replace 替换由itsa创建的变量(如果他们已经存在)。如果指定prefix(),则只会替换由itsa创建的具有相同前缀的变量。
prefix (string) 为itsa创建的变量名添加前缀。建议使用短前缀。
model**_options** 当选择paris模型时,指定所有可用的prais选项。否则将指定除lag()之外的所有可用的newey选项。

储存结果

因为itsa将所有输入的信息传递给prais和newey,所以这些命令储存的所有结果都是可用的。此外,itsa生成几个关键的时间序列变量并将它们添加到当前数据集中。这些额外的变量将允许用户使用ARIMA或其他时间序列模型进一步估计处理效果。

示例

1988年,加州通过了99号提案,试图通过提高烟草消费税来减少吸烟率。本例的数据包含1970-2000年间在州的水平上39个州的年人均香烟销售量(cigsale),其中以加州作为干预组,余下38州作为潜在的控制组,另有11个州因为实施了其他大规模烟草控制项目而被排除在样本之外。

单组干预分析

首先,加载数据并设置数据格式
接下来,以加利福尼亚州(数据集中的第3个州)为干预组,以1989年为起始点,采用一期滞后的newey回归进行估计,结果如下
如上图所示,人均香烟销售量的初始水平估计为134包(packs);1989年之前,香烟的销量的变化趋势为逐年下降1.78包。在干预发生后,第一年的香烟销量显著地下降了20包;而相较于干预前的趋势,干预后的变化趋势在-1.78的基础上再减少1.49包。我们还可以看到,这个结果与posttrend的lincom估计相吻合。下方的表格体现了lincom 估计的结果,它表明在提案通过后人均香烟销售量以每年3.27包的速度下降。图2展示了ITSA的可视化结果
为了确保我们的模型能够正确地描述自相关结构,我们使用actest命令来检验自相关性
如上图的右侧面板所示,自相关只在滞后为1时存在,因此,我们指定的lag(1)命令应该能够正确解释这种自相关性。
另一种方法是重新运行itsa,选择paris命令,该选项本质上是为了适应AR(1)模型而设计的。之后我们再添加rhotype(tscorr)命令与稳健标准误
由于使用prais产生的估计量是经过变换的,因此它们不能直接与使用OLS模型产生的newey估计进行比较。然而,其结果证实了,相较于干预前的趋势,香烟销量的变化趋势在干预发生后显著减少了2包。在最下方,Prais提供了Durbin-Watson d统计量作为衡量模型符合一阶自相关程度好坏的指标。d在0-4间取值,在零假设下,d等于2。d值小于2表示正的自相关,而d值大于2表示负的自相关。实践中还有一些更灵活、更直观的自相关测试,但遗憾的是目前还没有其他能够与prais命令联合使用的方法。

多组干预分析

在多组ITSA中,我们去掉single选项,将加州的数据与由其他38个州构成的控制组进行比较。
如上图所示,虽然处理组和控制组初始水平的差异z项不显著,但两组在干预前的趋势却有显著差异(z_t),38州的轨迹在整个观察期似乎总是高于加州。这一点在图3中也能直观地感受到。
人们有理由质疑这种在干预发生前就存在的组间差异会使结果产生偏差。因此在下面的例子中,我们将对照组的范围限制在那些与加州在基线水平和趋势上均相似的州(即均不显著)。通过迭代的方法,我们发现科罗拉多州、爱达荷州和蒙大拿州满足要求。将这三州作为对比,尽管干预发生后的瞬时效应z_x1989项并不显著,干预发生后两组斜率较之前变化的组间差异z_x_t1989却显著地为-1.97。此外,我们从posttrend的结果可以看到,干预组在1989年后每年的人均香烟销售量下降量为3.27包,而控制组在同期的下降量仅为1包,两者显著地相差2.28包/年。这个结果也强调了在引入多组ITSA时,确保干预组与控制组在前期水平和趋势上具有可比性的重要性。

多时间段

itsa可以适应观测期内有多项干预存在的情况,例如一项政策被实施、撤回和再次引入,或一项大范围的干预由多项具体政策汇集而成。
出于演示的需要,假设1982年为另一项干预的发生时间。将新的时间点添加到trperiod()中,现在我们重新进行单组的干预分析
直到第二次干预之前,所有系数的解释方法与之前一样。即将第一个干预期与非干预期进行比较。但是需要注意的是,第二个干预期的系数x1989和x_t1989是与前一个(第一个)干预期进行比较的。
从上表或下图均可以看出,有证据表明处理效应从1982年就已经开始出现,而在真正发生干预的1989年,香烟销量的变化趋势并没有进一步下降。
我们可以通过posttrend选项进一步证明这个效果,该选项分别估计第一和第二干预期后的干预后趋势。从结果中可以看出,1982年以后香烟销量的年下降幅度为3.84包/年,而1989年以后的年销量下降幅度略小,为3.27包/年。
因此本研究的结果揭示了在分析单组数据时定义多个干预期的另一个实用价值:它允许在干预真正开始之外的时间点测试“中断”效应。如本例所示,在99号提案实施的前几年,加州香烟的销售趋势便已经开始下降。这一结果也进一步强调了寻找一个可比较的控制组来代表反事实结果的重要性。

讨论

本文演示的itsa命令可以评估单组、多组比较,以及存在多个干预点时的处理效应。我们还讨论了诸如选择模型的标准、自相关检测、稳健性测试及选择可比较的控制组等等重要问题。通过包含额外的协变量来控制混杂、季节效应和外部事件的影响,itsa可以被用来估计更复杂的模型。另外,在运行itsa命令后生成的新变量使我们能够使用更复杂的OLS模型或ARIMA来进一步估计处理效应。
下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

2.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存