Stata:IV估计新方法-ivreg2m
👇 连享会 · 推文导航 | www.lianxh.cn
🍎 Stata:Stata基础 | Stata绘图 | Stata程序 | Stata新命令 📘 论文:数据处理 | 结果输出 | 论文写作 | 数据分享 💹 计量:回归分析 | 交乘项-调节 | IV-GMM | 时间序列 | 面板数据 | 空间计量 | Probit-Logit | 分位数回归 ⛳ 专题:SFA-DEA | 生存分析 | 爬虫 | 机器学习 | 文本分析 🔃 因果:DID | RDD | 因果推断 | 合成控制法 | PSM-Matching 🔨 工具:工具软件 | Markdown | Python-R-Stata 🎧 课程:公开课-直播 | 计量专题 | 关于连享会
连享会 · 2022 暑期班
作者:董洁妙 (暨南大学)
邮箱:graceveio@163.com
温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码,直达原文:
目录
1. 背景简介
2. 命令介绍
3. Stata 实操
4. 结语
5. 参考资料
6. 相关推文
1. 背景简介
当某些观测值处理组划分的结果不是随机缺失,或者这些结果普遍存在错误测量时,对局部平均处理效果 (LATE) 的估计结果是有偏的。
具体地,Calvi 等 (2021) 在探讨印度妇女对家庭资源的控制权与家庭健康之间的因果关系时,使用妇女对家庭资源的控制程度作为 Treatment,并利用 1976 年至 2005 年间印度几个州颁布的《印度教继承法》修正案 (这一法案的颁布意味着赋予妇女继承其出生家庭财产的权利,改善了她们的外部选择) 构建工具变量并进行 IV 估计。
但是事实上,妇女对家庭资源的控制程度是不能被直接观测得到的,为了识别这一因果关系,作者提出使用结构模型进行估计。因此,Treatment 能否被准确识别将变得非常重要,错误识别将会导致 LATE 的估计结果出现较大的偏误。为了解决这些问题,Calvi 等 (2021) 提出了一种新的估计方法 (Mismeasurement Robust LATE,MR-LATE) 来修正 LATE 估计结果。
首先,将 Treatment 拆分为 Ta (Ta=1 表示获得处理的状态,Ta=0 表示未获得处理的状态) 和 Tb (Tb=1 表示处理数据缺失或处理数据存在偏误的状态,Tb=0 表示未获得处理的状态) 两组二元处理变量,对应构建双方程的结构模型; 接着,通过非线性似不相关回归 (SUR) 估计 Ta 的系数,捕捉修正后的 LATE,估计 Tb 的系数,用于隔绝遗漏变量或误差所造成的影响。
在新方法下,当处理组的识别指标包含缺失值时,MR-LATE 可以识别并一致地估计 LATE。当处理组的划分出现错误时,MR-LATE 可以减少传统 LATE 的估计偏差。为了推广这一估计方法的使用,Calvi 等 (2021) 编写了 MR-LATE 的估计命令 ivreg2m
。本文的目的是介绍 ivreg2m
命令的使用方法。
在正式介绍之前,本文先对 ivreg2m
命令的使用补充以下几个重要事项:
第一, ivreg2m
不仅可以分别估计处理组的识别指标缺失和识别错误条件下的 LATE,还可以估计同时存在上述问题条件下的 LATE。第二, ivreg2m
是在现有的xtivreg2
和ivreg2
的框架上建立的,所以一切关于xtivreg2
和ivreg2
的拓展指令几乎都可以在ivreg2m
中使用。第三, ivreg2m
和ivreg2
之间存在三个主要区别。首先,在运行该命令之前,用户必须生成一个离散的处理变量,并至少包含以下三个赋值:是否位于处理组,是否位于控制组,是否为缺失、误测或者其他未知的状态。其次,在估计过程中,可以同时设定一个或多个工具变量,但工具变量也必须满足二元或离散 (整数) 值的变量设定。最后,该命令只支持 VCE 的单向聚类。第四, ivreg2
和ranktest
软件包必须从 SSC 中安装。同时,不应使用ivreg2
的早期版本。
2. 命令介绍
命令安装:
ssc install ivreg2m, replace
命令语法:
ivreg2m depvar [varlist] (treatment=varlist_iv) [weight] [if exp] [in range] [, ta(string) tb(string) options]
depvar
:指定回归的被解释变量;treatment
:指定回归中存在错误的原始处理变量的名称;ta(string)
:定义处理组中处理变量 Ta 的数字值,默认为ta(1)
;tb(string)
:定义控制组中处理变量 Ta 的数字值,默认为tb(-1)
。
3. Stata 实操
为了更好地理解 MR-LATE 在实际分析中的应用,Calvi 等 (2021) 使用是否加入美国退休金 401k 计划对个人净固定资产的影响进行举例。401k 计划是指美国 1978 年《国内税收法》新增的第 401 条 k 项条款的规定,具体指代一种由雇员、雇主共同缴费建立起来的完全基金式的养老保险制度。
但是,在美国养老保险制度的选择并不唯一。美国还推出了个人退休金账户计划 (以下简称 IRA计划) 作为备选。那么,在分析个是否加入 401k 计划对个人净固定资产的影响时,难免会面临着遗漏 IRA 计划所造成 LATE 的偏误。这种情况,可以通过 ivreg2m
命令估计 MR-LATE 进行解决:
第一,调用数据进行回归分析。
. ssc install bcuse, replace
. bcuse 401ksubs, clear
第二,生成一个处理变量 (离散型),至少包含三个不同的取值。
. generate treat = (p401k & pira)
. replace treat = -1 if (p401k==0 & pira==0)
第三,使用 ivreg2m
命令进行估计,解释变量包括错误分类的 Treatment 变量,以及一个二元的工具变量。
. ivreg2m nettfa (treat = e401k), ta(1) tb(-1)
MR-LATE point and interval estimate:
(1) treat_a - treat_b = 0
------------------------------------------------------------------------------
nettfa | Coefficient Std. err. z P>|z| [95% conf. interval]
-------------+----------------------------------------------------------------
(1) | 72.666 2.613 27.81 0.000 67.545 77.788
------------------------------------------------------------------------------
第四,在第三步基础上加入控制变量和采用 Robust 标准误的回归结果。
. ivreg2m nettfa (treat = e401k) inc, robust ta(1) tb(-1)
MR-LATE point and interval estimate:
(1) treat_a - treat_b = 0
------------------------------------------------------------------------------
nettfa | Coefficient Std. err. z P>|z| [95% conf. interval]
-------------+----------------------------------------------------------------
(1) | 58.839 3.154 18.66 0.000 52.657 65.021
------------------------------------------------------------------------------
第五,在第四步基础上加入多项工具变量以及 cluster-robust 标准误的回归结果。
. ivreg2m nettfa (treat = e401k pira) inc, cluster(age) ta(1) tb(-1)
MR-LATE point and interval estimate:
(1) treat_a - treat_b = 0
------------------------------------------------------------------------------
nettfa | Coefficient Std. err. z P>|z| [95% conf. interval]
-------------+----------------------------------------------------------------
(1) | 58.104 3.386 17.16 0.000 51.467 64.741
------------------------------------------------------------------------------
4. 结语
相信大家在阅读本推文后,对如何使用 ivreg2m
命令估计修正后的 LATE (即 MR-LATE) 有了更深入的理解。不过,它也存在一些不足,比如只能够考虑单一偏误冲击所造成的影响。未来,几个可能性的优化方向包括:
允许估计两个以上的冲击偏误下的 MR-LATE; 对于多个工具变量的处理,可以根据每个工具平均 MR-LATEs,或者对错误分类概率施加同质性。
5. 参考资料
Baum, C., M. Schaffer, and S. Stillman. 2007. ivreg2: Stata module for extended instrumental variables/2SLS and GMM and AC/HAC, LIML and k-class regression. -Link- Schaffer, M. 2020. XTIVREG2: Stata module to perform extended IV/2SLS, GMM and AC/HAC, LIML and k-class regression for panel data models. -Link- Calvi, R., A. Lewbel, and D. Tommasi. 2021. LATE With Missing or Mismeasured Treatment. Journal of Business & Economic Statistics, forthcoming. -PDF- Imbens, G. W., and J. D. Angrist. 1994. Identification and Estimation of Local Average Treatment Effects. Econometrica 62(2): 467-475. -PDF- Tommasi, D., and L. Zhang. 2022. Identifying Program Benefits When Participation Is Misreported. IZA Discussion Paper 13430. -PDF-
6. 相关推文
Note:产生如下推文列表的 Stata 命令为:
lianxh 工具变量, m
安装最新版lianxh
命令:
ssc install lianxh, replace
专题:专题课程 工具变量:顶刊中的Shock-IV整理 专题:论文写作 Stata论文复现:份额移动法工具变量(Shift-Share IV) 专题:Stata命令 Stata新命令-pdslasso:众多控制变量和工具变量如何挑选? 专题:IV-GMM 工具变量:Shock-IV中预处理平衡的必要性 工具变量法:IV估计的信与不信 Stata:工具变量的秩检验-bootrantest Stata:无需工具变量的IV估计-kinkyreg- Stata:当工具变量小于内生变量时,该如何估计?-mmeiv Lasso一下:再多的控制变量和工具变量我也不怕-T217 IV在哪里?奇思妙想的工具变量 twostepweakiv:弱工具变量有多弱? 多个(弱)工具变量如何应对-IV-mivreg? IV:工具变量不满足外生性怎么办? IV-工具变量法:第一阶段系数符号确定时的小样本无偏估计 IV:可以用内生变量的滞后项做工具变量吗? Stata: 工具变量法 (IV) 也不难呀! IV-估计:工具变量不外生时也可以用! 专题:内生性-因果推断 Stata:内生变量与工具变量非线性关系处理-discretize 工具变量-IV:排他性约束及经典文献解读
课程推荐:因果推断实用计量方法
主讲老师:邱嘉平教授
🍓 课程主页:https://gitee.com/lianxh/YGqjp
New! Stata 搜索神器:
lianxh
和songbl
GIF 动图介绍
搜: 推文、数据分享、期刊论文、重现代码 ……
👉 安装:
. ssc install lianxh
. ssc install songbl
👉 使用:
. lianxh DID 倍分法
. songbl all
🍏 关于我们
连享会 ( www.lianxh.cn,推文列表) 由中山大学连玉君老师团队创办,定期分享实证分析经验。 直通车: 👉【百度一下: 连享会】即可直达连享会主页。亦可进一步添加 「知乎」,「b 站」,「面板数据」,「公开课」 等关键词细化搜索。