Stata:拐点回归的分位数处理效应估计-rkqte
👇 连享会 · 推文导航 | www.lianxh.cn
🍎 Stata:Stata基础 | Stata绘图 | Stata程序 | Stata新命令 📘 论文:数据处理 | 结果输出 | 论文写作 | 数据分享 💹 计量:回归分析 | 交乘项-调节 | IV-GMM | 时间序列 | 面板数据 | 空间计量 | Probit-Logit | 分位数回归 ⛳ 专题:SFA-DEA | 生存分析 | 爬虫 | 机器学习 | 文本分析 🔃 因果:DID | RDD | 因果推断 | 合成控制法 | PSM-Matching 🔨 工具:工具软件 | Markdown | Python-R-Stata 🎧 课程:公开课-直播 | 计量专题 | 关于连享会
连享会课程 · 2023 暑期班
作者:梁宇超 (中国人民大学)
邮箱:liangyuchao1997@126.com
温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码,直达原文:
目录
1. 简介
2. 基本原理
3. 命令介绍
4. 应用示范
5. 参考资料
6. 相关推文
1. 简介
在断点回归设计 (RDD) 中,我们主要利用结果变量和处理状态在断点处的跳跃进行因果推断。但是当两者在断点处是连续变量时,RDD 就难以识别因果效应,这种问题在研究中经常会出现,导致无法使用 RDD 来估计因果效应。
在这种情况下,如果两者在断点处存在拐点/弯折 (Kink),即斜率存在变化,则可以通过与 RDD 类似的思路,利用拐点回归设计 (Regression Kink Design, RKD) 的思路来识别因果效应。
在拐点回归设计 (RKD) 中,结果变量 和处理状态 在断点处可以存在跳跃,也可以是连续的。但要求它们相对于配置变量 的导数在断点处存在跳跃,从而 RKD 就可以利用断点处的导数变化 (即斜率变化) 来进行因果识别。
简言之,拐点回归设计就是将结果变量在断点处的弯折归因于处理状态 在断点处的弯折,相当于结果变量 和处理状态 相对于配置变量 导数的断点回归设计。
在拐点回归设计中,处理状态 可以是二元变量,也可以是关于配置变量 的连续函数。已有文献对拐点回归设计中的平均处理效应、连续处理变量下的分位数处理效应进行了研究。在此基础上,Chen et al., (2020) 开发了一个方法来估计二元处理变量下的拐点回归设计中的分位数处理效应。
rkqte
命令是在 Chen et al., (2020) 的基础上,对拐点回归设计 (RKD) 中的分位数处理效应 (QTE) 进行估计和稳健推断。该命令包含一个被解释变量 、一个二元处理变量 和一个配置变量 。主要结果包括多个分位数的分位数处理效应估计值和统一的 95% 置信区间。
该命令还能提供两个检验,即分位数处理效应在各个分位数均为 0 的原假设,以及分位数处理效应是常数的零假设 (不存在异质性处理效应)。注意,该命令仅适用于估计处理变量 为二元变量的情况,对于连续处理变量,参考 qrkd
命令。
2. 基本原理
rkqte
命令由 Chen et al., (2020) 提出,该文的主要贡献是提出了一种识别策略,具体的识别公式采用函数导数的局部瓦尔德比的形式。具体来说,利用条件期望函数导数的两个局部瓦尔德比的左逆差值来识别 RKD 中二元处理的分位数效应。
本文首先通过以下因果结构对随机向量 进行建模,其中:
在方程 (1) 中,结果变量 通过函数 由二元处理变量 、连续运行变量 和扰动因素 产生。方程 (2) 表示具有属性 的个体在每个假设处理选择 下产生的潜在结果随机变量。
实际处理选择 由 和 通过阈值交叉方程 (2) 确定。然而,我们无法观测到 或 。本文在这个模型中不强加任何统计独立性条件,因此,现有的工具变量分位数回归方法在这里不适用。特别地,本文不假定运行变量 与不可观测量 之间的统计独立性。相反,对 RKD 做出以下假设。
假设 1 (RKD):设 为设计的拐点位置。
(i) h 在 的删除邻域 中连续可微。 (ii) h 在 处连续。 (iii) ,其中 表示 。 (iv) 给定 的 的条件分布是绝对连续的,具有连续可微的条件密度函数 。 (v) 对于每个 ,对于每个 ,条件累积分布函数 是连续可微的。 (vi) 。
根据假设 1 所需的研究设计包括三个组成部分。首先,处理分配规则 h 在设计位置 处有一个拐点,但这个分配规则 h 在其他地方是平滑的。其次,每个其他函数都是平滑的。最后,在设计的拐点位置 处有足够的数据。在这种设计下,可以获得以下关于潜在结果 给定 事件的条件分布的识别结果。
定理 1 (识别):设定假设 1 (RKD) 适用于公式 (1) 和 (2)。然后有:
对所有的 成立。
一旦通过定理 1 中提出的公式确定了条件累积分布函数 ,其中 ,则条件分位数处理效应也相应地被确定。
在论文中,作者还对提出了对于条件分位数处理效应的估计和推断的过程指导,并在附录中附上了严格数学证明和推导过程,有兴趣的读者可自行查阅。
3. 命令介绍
在二元处理变量下的拐点回归设计中的分位数处理效应估计需要借助 rkqte
命令。
命令安装:
. ssc install rkqte, replace
命令语法:
. rkqte y d x [if] [in] [, k(real) cover(real) ql(real) qh(real) qn(real) bw(real)]
各个选择项的具体含义如下:
k(real)
:设置拐点的位置,默认值为k(0)
。cover(real)
:设置覆盖真实的分位数回归估计量的均匀置信区间的概率,默认置信区间值cover(.95)
。ql(real)
:设置分位数处理效应估计量的最低分位数,默认值为ql(.25)
。qh(real)
:设置分位数处理效应估计量的最高分位数,默认值为qh(.75)
。qn(real)
:设置分位数点的数量,默认值为qn(3)
。bw(real)
:设置于估计分位数处理效应估计量的带宽。
4. 应用示范
为了演示 rkqte
命令的基本语法与输出结果,我们采用 Lee (2008) 在论文中使用的美国议员选举结果的面板数据进行演示。值得注意的是,这份数据集最初是运用于断点回归设计 (RDD),主要研究上一届选举获胜的议员,是否会利用在位优势,在下一届选举中获得更高的支持率。
其中,变量 margin 取值范围为 -100 到 100,衡量议员在上一届选举中的支持率,定义为民主党的投票率减去最强对手的投票率。当支持优势高于零时,民主党将赢得该席位的选举,否则就会失败。变量 vote 取值范围为 0 到 100,衡量议员在本届选举中的支持率。在原文采用 RDD 设计进行研究时,margin 为驱动变量,根据 margin 是否大于 0,生成相应的状态变量 treatment,vote 为被解释变量。
首先,我们演示采用 rdrobust
命令进行普通拐点回归估计的结果。
. lxhuse rdrobust_senate.dta, clear
. rdrobust vote margin, deriv(1)
Sharp Kink RD estimates using local polynomial regression.
Cutoff c = 0 | Left of c Right of c Number of obs = 1297
-------------------+---------------------- BW type = mserd
Number of obs | 595 702 Kernel = Triangular
Eff. Number of obs | 389 346 VCE method = NN
Order est. (p) | 2 2
Order bias (q) | 3 3
BW est. (h) | 19.842 19.842
BW bias (b) | 33.284 33.284
rho (h/b) | 0.596 0.596
Outcome: vote. Running variable: margin.
---------------------------------------------------------------------
Method | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+-------------------------------------------------------
Conventional | .70748 .535 1.3224 0.186 -.341104 1.75606
Robust | - - 1.4156 0.157 -.385993 2.39346
---------------------------------------------------------------------
然后,我们采用本文主要介绍的 rkqte
命令进行拐点回归分位数效应的结果,结果默认展示了 0.25、0.5 以及 0.75 分位数的估计结果和置信区间。
. gen treatment = (margin > 0)
. rkqte vote treatment margin
-------------------------------------------------------------------------
Executing:Chen, H., Chiang, H.D., & Sasaki, Y. (2020): Quantile Treatment
Effects in Regression Kink Designs. Econometric Theory, 36 (6):
1167-1191.
-------------------------------------------------------------------------
Estimating QTE
Estimating Variance
-------------------------------------------------------------------------
Fuzzy Regression Kink Design
Number of observations: n = 1297
The kink location of the running variable: k = 0
-------------------------------------------------------------------------
Quantile QTE [95% Unif. Conf. Band]
------------------------------------------------
0.250 3.75843 -16.03067 23.54753
0.500 3.75843 -16.03067 23.54753
0.750 6.26406 -13.52504 26.05316
------------------------------------------------------------------------------
Test of the hypothesis that QTE=0 for all quantiles: p-value = 1.000
Test of the hypothesis that QTE is constant across quantiles: p-value = 1.000
------------------------------------------------------------------------------
我们还可以通过添加选择项的方式,提供不同分位数处的估计结果。如下结果演示了从最低分位数 0.1,到最高分位数 0.9,并提供 9 个分位数点的估计结果。
. rkqte vote treatment margin, ql(0.1) qh(0.9) qn(9)
-------------------------------------------------------------------------
Executing:Chen, H., Chiang, H.D., & Sasaki, Y. (2020): Quantile Treatment
Effects in Regression Kink Designs. Econometric Theory, 36 (6):
1167-1191.
-------------------------------------------------------------------------
Estimating QTE
Estimating Variance
-------------------------------------------------------------------------
Fuzzy Regression Kink Design
Number of observations: n = 1297
The kink location of the running variable: k = 0
-------------------------------------------------------------------------
Quantile QTE [95% Unif. Conf. Band]
------------------------------------------------
0.100 0.00000 -32.15933 32.15933
0.200 0.73081 -31.42852 32.89013
0.300 3.75843 -28.40089 35.91776
0.400 3.75843 -28.40089 35.91776
0.500 3.75843 -28.40089 35.91776
0.600 6.26406 -25.89527 38.42338
0.700 6.26406 -25.89527 38.42338
0.800 5.84645 -26.31287 38.00578
0.900 7.83007 -24.32926 39.98940
------------------------------------------------------------------------------
Test of the hypothesis that QTE=0 for all quantiles: p-value = 1.000
Test of the hypothesis that QTE is constant across quantiles: p-value = 1.000
------------------------------------------------------------------------------
5. 参考资料
Chen H, Chiang H D, Sasaki Y. Quantile treatment effects in regression kink designs[J]. Econometric Theory, 2020, 36(6): 1167-1191. -PDF- 刘冲, 诸宇灵, 李皓宇. 断点回归设计:理论前沿进展与新应用场景[J]. 经济学报, 2022, 9(03):325-366. -PDF- 拐点回归设计RKD概览, 及其开展实证研究的经典示例 -Link- Lee D S. Randomized experiments from non-random selection in US House elections[J]. Journal of Econometrics, 2008, 142(2): 675-697. -PDF-
6. 相关推文
Note:产生如下推文列表的 Stata 命令为:
lianxh
安装最新版lianxh
命令:
ssc install lianxh, replace
专题:专题课程 ⏩ 因果推断专题-RDD-DID-IV-合成控制 专题:断点回归RDD Stata:pzms-RDD和RKD的最优模型选择 RDD-断点回归:实践指南 Stata:RDD与RKD的最优模型选择-pzms Stata论文复现:适用于小样本的RDD rddensity-RDD中的平滑性检验和操纵检验 倒U型+RDD:利用断点回归检验 U 形关系 Stata:RDD-DID-断点回归与倍分法完美结合 RDD断点回归:多个断点多个分配变量如何处理 当PSM遇上RDD:rddsga命令详解 Stata+R:一文读懂精确断点回归-RDD RDD:离散变量可以作为断点回归的分配变量吗? rddensity, lpdensity无法安装?那就手动安装 RDD:断点回归可以加入控制变量吗? 断点回归RDD:样本少时如何做? Stata:断点回归分析-RDD-文献和命令 Stata:RDD-中可以加入控制变量 Stata:两本断点回归分析-RDD-易懂教程 Stata:时间断点回归RDD的几个要点 Stata:断点回归分析-(RDD)-文献和命令 Stata:断点回归RDD简明教程 RDD:断点回归的非参数估计及Stata实现 Stata: 两本断点回归分析 (RDD) 易懂教程 Stata: 断点回归 (RDD) 中的平滑性检验 Stata 新命令:多断点 RDD 分析 - rdmc RDD 最新进展:多断点 RDD、多分配变量 RDD 专题:内生性-因果推断 Abadie新作:简明IV,DID,RDD教程和综述 专题:答疑-板书 FAQs答疑-2021寒假-Stata高级班-Day3-连玉君-RDD-合成控制法
课程推荐:2023 暑期班
主讲老师:连玉君,王群勇
🍓 课程主页:https://www.lianxh.cn/news/fdc69c3695aec.html
New! Stata 搜索神器:
lianxh
和songbl
GIF 动图介绍
搜: 推文、数据分享、期刊论文、重现代码 ……
👉 安装:
. ssc install lianxh
. ssc install songbl
👉 使用:
. lianxh DID 倍分法
. songbl all
🍏 关于我们
连享会 ( www.lianxh.cn,推文列表) 由中山大学连玉君老师团队创办,定期分享实证分析经验。 直通车: 👉【百度一下: 连享会】即可直达连享会主页。亦可进一步添加 「知乎」,「b 站」,「面板数据」,「公开课」 等关键词细化搜索。