查看原文
其他

断点回归前沿-拐点回归/弯折断点回归设计操作及应用


计量经济学服务中心专辑汇总计量百科·资源·干货:
Stata  |Python  |Matlab  |Eviews  |R 
Geoda  |ArcGis  |GeodaSpace  |SPSS 
一文读懂   |数据资源   |回归方法  |网络爬虫                                                               
限回归   |工具变量   |内生性   |空间计量 
果推断   |合成控制法   |倾向匹配得分   |断点回归   |双重差   
面板数据  | 动态面板数据


断点回归由Thistlewaite and Campbell(1960)首次使用,但直到1990年代末才引起经济学家的重视。


Thistlethwaite、Campbell于1960年首次提出使用断点回归设计研究处理效应, 在该文中他们的目的是研究奖学金对于未来学业的影响, 学生是否获得奖学金取决于考试的分数。由于奖学金由学习成绩决定,故成绩刚好达到获奖标准与差一点达到的学生具有可比性。如果考试分数大于获奖标准分数, 则进入处理组;如果考试分数小于获奖标准分数, 则进入控制组。因此处理变量在获奖标准分数处形成了一个断点, 该研究设计的主要思想是可以利用靠近这一断点附近的样本来有效估计处理效应。


Angrist and Lavy(1999)在研究班级规模对成绩的影响时,利用以色列教育系统的一项制度进行断点回归;该制度限定班级规模的上限为40名学生,一旦超过40名学生(比如41名学生),则该班级被一分为二。


此后30年, 该方法并未引起学术界的重视,直到1990年以后, 断点回归设计开始被应用于各种领域,并且近年来成为因果分析和政策评估领域最重要的研究方法。


Hahn et al(2001)提供了断点回归在计量经济学理论基础。目前,断点回归在教育经济学、劳动经济学、健康经济学、政治经济学以及区域经济学的应用仍方兴未艾。参见Imbens and Lemieux(2008),Van Der Klaauw(2008)以及Lee and Lemieux(2010)的文献综述。


断点回归设计是一种准自然实验, 其基本思想是存在一个连续变量, 该变量能决定个体在某一临界点两侧接受政策干预的概率, 由于X在该临界点两侧是连续的,因此个体针对X的取值落入该临界点任意一侧是随机发生的, 即不存在人为操控使得个体落入某一侧的概率更大, 则在临界值附近构成了一个准自然实验。一般将该连续变量X称为分组变量 (assignment variable) 


1
弯折断点回归操作应用

弯折断点回归可以使用rdrobust命令


1、rdrobust:


rdrobust有两个配套命令:rdbwselect用于带宽选择,rdplot用于RD绘图(详细信息请参见Calonico、Cattaneo和Titiunik [2015a])。


下载安装方法为:


net install rdrobust , from ( http : //www-personal.umich.edu/~cattaneo/rdrobust)net install rdrobust,from(htp:// www-personal umich. edu/cattaneo/software/rdrobust/stata) replace

rdrobust语法格式为:
rdrobust depvar runvar [if] [in] [, c(cutoff) p(pvalue) q(qvalue) deriv(dvalue) fuzzy(fuzzyvar [sharpbw]) covs(covars) kernel(kernelfn) weights(weightsvar) h(hvalueL hvalueR)                b(bvalueL bvalueR) rho(rhovalue) scalepar(scaleparvalue) bwselect(bwmethod) scaleregul(scaleregulvalue) vce(vcemethod) level(level) all]                


语法含义为:


depvar可以是结果变量、原因变量或其他协变量

runvar是参考变量


其他可选项。

c(cutoff) specifies the RD cutoff. The default is c(0).c(cutoff)用于设定断点位置,默认为0。


p(pvalue) specifies the order of the local polynomial used to construct the point estimator. The default is p(1) (local linear regression). p(pvalue)设定多项式阶数,默认为1,局部线性回归。


q(qvalue) specifies the order of the local polynomial used to construct the bias correction. The default is q(2) (local quadratic regression).


covs(covars) 表示加上协变量


kernel(kernelfn) specifies the kernel function used to construct the local polynomial estimators. kernelfn may be triangular, epanechnikov, or uniform. The default is kernel(triangular).即表示

设定多项式拟合时的核函数,kernelfn可以有三种选择:三角核函数 triangular、Epanechnikov核函数、矩形核函数 uniform,默认为三角核。


level(level)设置置信水平,默认为level(95).


h(hvalueL hvalueR)指定主要带宽h,分别用在断点的左边和右边。如果只指定一个值,则对该值使用左右两边。如果没有指定,则由相应的命令rdbwselect计算带宽h。


b(bvalueL bvalueR)指定在断点左侧和右侧分别使用的偏差调整带宽b。如果只指定一个值,则对该值使用双方。如果没有指定,则由相应的命令rdbwselect计算带宽b。


一般带宽和偏差带宽不加上,系统由相应的命令rdbwselect计算带宽。


rho(rhovalue)指定的值,使得偏置带宽b等于b=h/rho。如果指定了h而没有指定b,那么默认值是(1)。

scalepar(scaleparvalue)指定感兴趣的RD参数的调整项。当感兴趣的总体参数涉及已知的乘法时,此选项非常有用子(例如,sharp kink RD)。默认是scalepar(1)(没有缩放)。


all表示程序rdrobust报告三个不同的程序:i)用传统方差估计进行常规RD估计;ii)使用传统方差估计器进行偏差校正的RD估计;和iii)带有稳健方差估计的偏差校正RD估计。


一般形式为:


rdrobust depvar runvar,c(#) p(#)  kernel(kernelfn) bwselect(bwmethod)  fuzzy(fuzzyvar) all deriv(1)


选项含义为:

c(cutoff) specifies the RD cutoff. The default is c(0).c(cutoff)用于设定断点位置,默认为0。


p(pvalue) specifies the order of the local polynomial used to construct the point estimator. The default is p(1) (local linear regression). p(pvalue)设定多项式阶数,默认为1,局部线性回归。


covs(covars) 表示加上协变量


kernel(kernelfn) specifies the kernel function used to construct the local polynomial estimators. kernelfn may be triangular, epanechnikov, or uniform. The default is kernel(triangular).即表示

设定多项式拟合时的核函数,kernelfn可以有三种选择:三角核函数 triangular、Epanechnikov核函数、矩形核函数 uniform,默认为三角核。

deriv(1) 表示估计回归方程的一阶导数,即拐点回归。

fuzzy(D)表示进行模糊拐点回归,并以Dfuzzyvar 作为处理变量;默认为精确拐点回归




2
弯折断点回归操作应用




*-使用 David S.Lee (2007) 参议院选举的数据use rdrobust_senate.dtaeditdesc




第2步:弯折断点回归操作


 rdrobust vote margin, fuzzy(margin)  all deriv(1)
Fuzzy kink RD estimates using local polynomial regression.
Cutoff c = 0 | Left of c Right of c Number of obs = 1297-------------------+---------------------- BW type = mserd Number of obs | 595 702 Kernel = TriangularEff. Number of obs | 555 546 VCE method = NN Order est. (p) | 2 2 Order bias (q) | 3 3 BW est. (h) | 45.791 45.791 BW bias (b) | 100.000 100.000 rho (h/b) | 0.458 0.458
First-stage estimates. Outcome: margin. Running variable: margin.-------------------------------------------------------------------------------- Method | Coef. Std. Err. z P>|z| [95% Conf. Interval]-------------------+------------------------------------------------------------ Conventional | 5.3e-15 .00092 0.0000 1.000 -.001797 .001797 Bias-corrected | 3.6e-15 .00092 0.0000 1.000 -.001797 .001797 Robust | 3.6e-15 .00201 0.0000 1.000 -.003946 .003946--------------------------------------------------------------------------------
Treatment effect estimates. Outcome: vote. Running variable: margin. Treatment Status: margin.-------------------------------------------------------------------------------- Method | Coef. Std. Err. z P>|z| [95% Conf. Interval]-------------------+------------------------------------------------------------ Conventional | 2.1e+13 3.6e+24 0.0000 1.000 -7.1e+24 7.1e+24 Bias-corrected | 4.0e+13 3.6e+24 0.0000 1.000 -7.1e+24 7.1e+24 Robust | 4.0e+13 7.9e+24 0.0000 1.000 -1.5e+25 1.5e+25--------------------------------------------------------------------------------
. end of do-file
. rdrobust vote margin, all deriv(1)
Sharp kink RD estimates using local polynomial regression.
Cutoff c = 0 | Left of c Right of c Number of obs = 1297-------------------+---------------------- BW type = mserd Number of obs | 595 702 Kernel = TriangularEff. Number of obs | 389 346 VCE method = NN Order est. (p) | 2 2 Order bias (q) | 3 3 BW est. (h) | 19.842 19.842 BW bias (b) | 33.284 33.284 rho (h/b) | 0.596 0.596
Outcome: vote. Running variable: margin.-------------------------------------------------------------------------------- Method | Coef. Std. Err. z P>|z| [95% Conf. Interval]-------------------+------------------------------------------------------------ Conventional | .70748 .535 1.3224 0.186 -.341104 1.75606 Bias-corrected | 1.0037 .535 1.8761 0.061 -.044849 2.05231 Robust | 1.0037 .70906 1.4156 0.157 -.385993 2.39346--------------------------------------------------------------------------------






您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存