查看原文
其他

Stata:IV估计新方法-ivreg2m

连享会 连享会 2023-10-24

👇 连享会 · 推文导航 | www.lianxh.cn

连享会 · 2022 暑期班

作者:董洁妙 (暨南大学)
邮箱:graceveio@163.com

温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码,直达原文:


目录

  • 1. 背景简介

  • 2. 命令介绍

  • 3. Stata 实操

  • 4. 结语

  • 5. 参考资料

  • 6. 相关推文



1. 背景简介

当某些观测值处理组划分的结果不是随机缺失,或者这些结果普遍存在错误测量时,对局部平均处理效果 (LATE) 的估计结果是有偏的。

具体地,Calvi 等 (2021) 在探讨印度妇女对家庭资源的控制权与家庭健康之间的因果关系时,使用妇女对家庭资源的控制程度作为 Treatment,并利用 1976 年至 2005 年间印度几个州颁布的《印度教继承法》修正案 (这一法案的颁布意味着赋予妇女继承其出生家庭财产的权利,改善了她们的外部选择) 构建工具变量并进行 IV 估计。

但是事实上,妇女对家庭资源的控制程度是不能被直接观测得到的,为了识别这一因果关系,作者提出使用结构模型进行估计。因此,Treatment 能否被准确识别将变得非常重要,错误识别将会导致 LATE 的估计结果出现较大的偏误。为了解决这些问题,Calvi 等 (2021) 提出了一种新的估计方法 (Mismeasurement Robust LATE,MR-LATE) 来修正 LATE 估计结果。

  • 首先,将 Treatment 拆分为 Ta (Ta=1 表示获得处理的状态,Ta=0 表示未获得处理的状态) 和 Tb (Tb=1 表示处理数据缺失或处理数据存在偏误的状态,Tb=0 表示未获得处理的状态) 两组二元处理变量,对应构建双方程的结构模型;
  • 接着,通过非线性似不相关回归 (SUR) 估计 Ta 的系数,捕捉修正后的 LATE,估计 Tb 的系数,用于隔绝遗漏变量或误差所造成的影响。

在新方法下,当处理组的识别指标包含缺失值时,MR-LATE 可以识别并一致地估计 LATE。当处理组的划分出现错误时,MR-LATE 可以减少传统 LATE 的估计偏差。为了推广这一估计方法的使用,Calvi 等 (2021) 编写了 MR-LATE 的估计命令 ivreg2m。本文的目的是介绍 ivreg2m 命令的使用方法。

在正式介绍之前,本文先对 ivreg2m 命令的使用补充以下几个重要事项:

  • 第一,ivreg2m 不仅可以分别估计处理组的识别指标缺失和识别错误条件下的 LATE,还可以估计同时存在上述问题条件下的 LATE。
  • 第二,ivreg2m 是在现有的 xtivreg2ivreg2 的框架上建立的,所以一切关于 xtivreg2ivreg2 的拓展指令几乎都可以在 ivreg2m 中使用。
  • 第三,ivreg2mivreg2 之间存在三个主要区别。首先,在运行该命令之前,用户必须生成一个离散的处理变量,并至少包含以下三个赋值:是否位于处理组,是否位于控制组,是否为缺失、误测或者其他未知的状态。其次,在估计过程中,可以同时设定一个或多个工具变量,但工具变量也必须满足二元或离散 (整数) 值的变量设定。最后,该命令只支持 VCE 的单向聚类。
  • 第四,ivreg2ranktest 软件包必须从 SSC 中安装。同时,不应使用 ivreg2 的早期版本。

2. 命令介绍

命令安装:

ssc install ivreg2m, replace

命令语法:

ivreg2m depvar [varlist] (treatment=varlist_iv) [weight] [if exp] [in range] [, ta(string) tb(string) options]
  • depvar:指定回归的被解释变量;
  • treatment:指定回归中存在错误的原始处理变量的名称;
  • ta(string):定义处理组中处理变量 Ta 的数字值,默认为 ta(1)
  • tb(string):定义控制组中处理变量 Ta 的数字值,默认为 tb(-1)

3. Stata 实操

为了更好地理解 MR-LATE 在实际分析中的应用,Calvi 等 (2021) 使用是否加入美国退休金 401k 计划对个人净固定资产的影响进行举例。401k 计划是指美国 1978 年《国内税收法》新增的第 401 条 k 项条款的规定,具体指代一种由雇员、雇主共同缴费建立起来的完全基金式的养老保险制度。

但是,在美国养老保险制度的选择并不唯一。美国还推出了个人退休金账户计划 (以下简称 IRA计划) 作为备选。那么,在分析个是否加入 401k 计划对个人净固定资产的影响时,难免会面临着遗漏 IRA 计划所造成 LATE 的偏误。这种情况,可以通过 ivreg2m 命令估计 MR-LATE 进行解决:

第一,调用数据进行回归分析。

. ssc install bcuse, replace
. bcuse 401ksubs, clear

第二,生成一个处理变量 (离散型),至少包含三个不同的取值。

. generate treat = (p401k & pira)
. replace treat = -1 if (p401k==0 & pira==0)

第三,使用 ivreg2m 命令进行估计,解释变量包括错误分类的 Treatment 变量,以及一个二元的工具变量。

. ivreg2m nettfa (treat = e401k), ta(1) tb(-1)

MR-LATE point and interval estimate:
(1) treat_a - treat_b = 0
------------------------------------------------------------------------------
nettfa | Coefficient Std. err. z P>|z| [95% conf. interval]
-------------+----------------------------------------------------------------
(1) | 72.666 2.613 27.81 0.000 67.545 77.788
------------------------------------------------------------------------------

第四,在第三步基础上加入控制变量和采用 Robust 标准误的回归结果。

. ivreg2m nettfa (treat = e401k) inc, robust ta(1) tb(-1)

MR-LATE point and interval estimate:
(1) treat_a - treat_b = 0
------------------------------------------------------------------------------
nettfa | Coefficient Std. err. z P>|z| [95% conf. interval]
-------------+----------------------------------------------------------------
(1) | 58.839 3.154 18.66 0.000 52.657 65.021
------------------------------------------------------------------------------

第五,在第四步基础上加入多项工具变量以及 cluster-robust 标准误的回归结果。

. ivreg2m nettfa (treat = e401k pira) inc, cluster(age) ta(1) tb(-1)

MR-LATE point and interval estimate:
(1) treat_a - treat_b = 0
------------------------------------------------------------------------------
nettfa | Coefficient Std. err. z P>|z| [95% conf. interval]
-------------+----------------------------------------------------------------
(1) | 58.104 3.386 17.16 0.000 51.467 64.741
------------------------------------------------------------------------------

4. 结语

相信大家在阅读本推文后,对如何使用 ivreg2m 命令估计修正后的 LATE (即 MR-LATE) 有了更深入的理解。不过,它也存在一些不足,比如只能够考虑单一偏误冲击所造成的影响。未来,几个可能性的优化方向包括:

  • 允许估计两个以上的冲击偏误下的 MR-LATE;
  • 对于多个工具变量的处理,可以根据每个工具平均 MR-LATEs,或者对错误分类概率施加同质性。

5. 参考资料

  • Baum, C., M. Schaffer, and S. Stillman. 2007. ivreg2: Stata module for extended instrumental variables/2SLS and GMM and AC/HAC, LIML and k-class regression. -Link-
  • Schaffer, M. 2020. XTIVREG2: Stata module to perform extended IV/2SLS, GMM and AC/HAC, LIML and k-class regression for panel data models. -Link-
  • Calvi, R., A. Lewbel, and D. Tommasi. 2021. LATE With Missing or Mismeasured Treatment. Journal of Business & Economic Statistics, forthcoming. -PDF-
  • Imbens, G. W., and J. D. Angrist. 1994. Identification and Estimation of Local Average Treatment Effects. Econometrica 62(2): 467-475. -PDF-
  • Tommasi, D., and L. Zhang. 2022. Identifying Program Benefits When Participation Is Misreported. IZA Discussion Paper 13430. -PDF-

6. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh 工具变量, m
安装最新版 lianxh 命令:
ssc install lianxh, replace

  • 专题:专题课程
    • 工具变量:顶刊中的Shock-IV整理
  • 专题:论文写作
    • Stata论文复现:份额移动法工具变量(Shift-Share IV)
  • 专题:Stata命令
    • Stata新命令-pdslasso:众多控制变量和工具变量如何挑选?
  • 专题:IV-GMM
    • 工具变量:Shock-IV中预处理平衡的必要性
    • 工具变量法:IV估计的信与不信
    • Stata:工具变量的秩检验-bootrantest
    • Stata:无需工具变量的IV估计-kinkyreg-
    • Stata:当工具变量小于内生变量时,该如何估计?-mmeiv
    • Lasso一下:再多的控制变量和工具变量我也不怕-T217
    • IV在哪里?奇思妙想的工具变量
    • twostepweakiv:弱工具变量有多弱?
    • 多个(弱)工具变量如何应对-IV-mivreg?
    • IV:工具变量不满足外生性怎么办?
    • IV-工具变量法:第一阶段系数符号确定时的小样本无偏估计
    • IV:可以用内生变量的滞后项做工具变量吗?
    • Stata: 工具变量法 (IV) 也不难呀!
    • IV-估计:工具变量不外生时也可以用!
  • 专题:内生性-因果推断
    • Stata:内生变量与工具变量非线性关系处理-discretize
    • 工具变量-IV:排他性约束及经典文献解读

课程推荐:因果推断实用计量方法
主讲老师:邱嘉平教授
🍓 课程主页https://gitee.com/lianxh/YGqjp

New! Stata 搜索神器:lianxhsongbl  GIF 动图介绍
搜: 推文、数据分享、期刊论文、重现代码 ……
👉 安装:
. ssc install lianxh
. ssc install songbl
👉  使用:
. lianxh DID 倍分法
. songbl all

🍏 关于我们

  • 连享会 ( www.lianxh.cn,推文列表) 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 直通车: 👉【百度一下: 连享会】即可直达连享会主页。亦可进一步添加 「知乎」,「b 站」,「面板数据」,「公开课」 等关键词细化搜索。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存