查看原文
其他

搞定内生性,不可不知的工具变量法笔记

内生性( endogeneity)问题,是指由自变量与误差项相关所引发的估计偏倚及统计结果误导性等问题的总称,即违背了线性回归中的正交假定而产生的一系列问题。内生性问题看似简单,但目前已成为线性回归及其他回归模型中最为棘手的问题。

工具变量法是解决内生性问题的有效方法。

在工具变量估计中,第一,检验是否具有内生性,可以使用豪斯曼检验。第二,工具变量的正交性检验。(1)、强度条件,即工具变量应该与内生自变量具有较强的相关性,即该工具变量的应该能够代替或者表达原内生变量的信息,数学表达式为:COV(Z,X)=/0
(2)、排除限制条件,即工具变量应该与误差项不相关,也就是与因变量Y中不能被已有的自变量x所表达的部分无关(也是与误差项无关)COV(Z,u)=/0

工具变量估计
二阶段最小二乘法的第一阶段就是利用原模型的内生解释变量对工具变量进行OLS,得到解释变量的拟合值;第二步,利用得到解释变量的拟合值对原模型进行最小二乘法,从而得到方程模型的估计值,这样就可以消除内生性的影响。

首先了解一下二阶段最小二乘法Stata中的命令为ivregress,语法格式为

ivregress estimator depvar [varlist1] (varlist2 = varlist_iv) [if] [in] [weight] [, options]

选项介绍

estimator分为2sls两阶段最小二乘、liml有限的信息最大似然(liml) 、gmm广义矩方法(gmm)

depvardepvar 为被解释变量;

varlist1为外生解释变量;

varlist2 为所有的内生解释变量;

varlist_iv为所有的工具变量;

在选项 options 中,

vce(robust)表示稳健型标准误

可使用 firstfirst 选项报告 2SLS 中第一阶段的回归结果

small表示小样本下的自由度调整

本文以伍德里奇第十五章数据mroz.dta为例,研究已婚妇女的教育回报,相关数据介绍如下:
use morz.dtaeditdesc*被解释变量label var lwage 已婚妇女工资的对数值*解释变量label var educ 受教育年数 label var exper 工作年限label var expersq 工作年限平方
*工具变量label var fatheduc 已婚妇女的父亲的受教育年数label var motheduc 已婚妇女的母亲的受教育年限

其中研究问题为:

建立lnwage与educ、exper 、expersq的方程,但是包括了影响已婚妇女工资的遗漏变量,可能存在内生性问题,其中 能力 会对工资产生影响,但是却与解释变量X中的educ相关,内生性存在。

因此需要寻找与 能力 相关,但是与误差项不相关的工具变量,认为已婚妇女的父亲和母亲的受教育年数跟已婚妇女的 educ相关的,而这两个变量与已婚妇女的 能力 相关,可以替代原来内生变量的信息。因此,可以作为 educ的工具变量。

相关操作代码为:

*OLS回归与2SLS对比
reg lwage educ exper expersqest store OLS
ivregress 2sls lwage exper expersq (educ = motheduc fatheduc)est store _2SLS
结果为:


同时展现并对其进行对比,代码为:
esttab OLS _2SLS , /// title("已婚妇女教育投入回报影响研究") replace /// mtitles("OLS回归" "2SLS回归结果" ) /// b(%6.3f) se /// star( * 0.10 ** 0.05 *** 0.01 ) /// addnotes("*** 1% ** 5% * 10%") staraux r2 nogap compress

结果为:


结果解释:

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存