查看原文
其他

怎样找到一个巧妙的工具变量, IV在公共政策评估中的应用

凡是搞计量经济的,都关注这个号了
稿件:econometrics666@126.com
所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

关于IV工具变量方法

1.内生性问题操作指南, 广为流传的22篇文章,2.看完顶级期刊文章后, 整理了内生性处理小册子,3.如何寻找工具变量?得工具者得实证计量,4.内生性处理的秘密武器-工具变量估,5.工具变量在社会科学因果推断中的应用,6.为你的"工具变量"合理性进行辩护, 此文献可以作为范例,7.没有工具变量、断点和随机冲击,也可以推断归因,8.工具变量与因果推断, 明尼苏达Bellemare关于IV的分析,9.工具变量IV与内生性处理的精细解读,10.我的"工具变量"走丢了,寻找工具变量思路手册,11.面板数据里处理多重高维固定效应的神器, 还可用工具变量处理内生性,12.豪斯曼, 拉姆齐检验,过度拟合,弱工具和过度识别,模型选择和重抽样问题,13.工具变量先锋 Sargan,供参考,14.AEA期刊的IV靠不靠谱?15.计量大焖锅: iv, clorenz, rank, scalar, bys, xtile, newey, nlcom,16.GMM是IV、2SLS、GLS、ML的统领,待我慢慢道来,17.IV和GMM相关估计步骤,内生性、异方差性等检验方法,18.因果推断IV方法经典文献,究竟是制度还是人力资本促进了经济的发展?19.内生变量的交互项如何寻工具变量, 交互项共线咋办,20.面板数据、工具变量选择和HAUSMAN检验的若干问题,21.IV和Matching老矣, “弹性联合似然法”成新趋势,22.IV回归系数比OLS大很多咋回事, 怎么办呢? ,23.不用IV, 基于异方差识别方法解决内生性, 赐一篇文献,24.找不到IV, RD和DID该怎么办? 这有一种备选方法,25.内生转换模型vs内生处理模型vs样本选择模型vs工具变量2SLS,26.内生性, 工具变量与 GMM估计, 程序code附,27.GMM和工具变量在面板数据中的运用,28.关于工具变量的材料包, 标题,模型,内生变量,工具变量,29.必须使用所有外生变量作为工具变量吗?30.工具变量精辟解释, 保证你一辈子都忘不了,31.毛咕噜论文中一些有趣的工具变量!33.前沿: 删失数据分位数工具变量(CQIV)估计, 做删失数据异质性效应分析,34.不需要找工具变量, 新方式构建工具变量, 导师再也不用担心内生性问题了!35.关于顶级外刊工具变量的使用最全策略, 不收藏反复读就不要谈IV估计!36.如何通过因果图选择合适的工具变量?一份关于IV的简短百科全书37.前沿: nature刊掀起DAG热, 不掌握就遭淘汰无疑!因果关系研究的图形工具!38.最清晰的内生性问题详解及软件操作方案!实证研究必备工具!39.中国女学者与其日本同行在JPE上发文了!利用独特数据, 地理断点RDD和IV研究中国环境议题!40.双胞胎样本解决遗漏变量和测量误差, LIV解决选择偏差41.内生性处理的秘密武器-工具变量估计42.工具变量IV必读文章20篇, 因果识别就靠他了43.看完顶级期刊文章后, 整理了内生性处理小册子44.“内生性” 到底是什么鬼? New Yorker告诉你,45.Heckman两步法的内生性问题(IV-Heckman),46.最全估计方法,解决遗漏变量偏差,内生性,混淆变量和相关问题47.非线性面板模型中内生性解决方案48.内生性处理方法与进展,49.万能cmp程序, 有了他, 建议把其他程序全删掉!50.你的内生性解决方式out, ERM独领风骚51.面板数据是怎样处理内生性的52.计量分析中的内生性问题综述53.一份改变实证研究的内生性处理思维导图54.Top期刊里不同来源内生性处理方法55.面板数据中heckman方法和程序(xtheckman),56.控制函数法CF, 处理内生性的广义方法57.二值选择模型内生性检验方法58.2SRI还是2SPS, 内生性问题的二阶段CF法实现59.非线性模型及离散内生变量处理利器, 应用计量经济学中的控制函数法!60.最全利用工具变量控制内生性的步骤和代码—在经管研究中的应用,61.如何选择合适的工具变量, 基于既有文献的总结和解释!62.中介效应最新进展: 中介效应中的工具变量法使用方法及其代码!63.弱工具变量的稳健性检验, 附上code和相关说明!64.工具变量对因果效应的识别和外推, 大牛的顶级评述!65.几百年一遇的工具变量让基于OLS的截面数据回归结果发到Top了, 设计巧妙让人叹服!66.一份使用工具变量回归的AER文章清单, 思路惊奇定会让你脑洞大开!67.估计工具变量回归时, 是否必须将所有外生变量用作工具变量?68.引力模型基础上的工具变量如何构建?69.必读, 宗教是如何阻碍经济发展的? 基于DID, IV和各种机制分析的AER量化史分析!70.JPE上利用地理断点RDD和IV研究中国环境议题的do文件release!71.工具变量IV估计免费课程, 文章, 数据和代码全在这里, 不学习可不要后悔!72.天下回归, 无内生性不破, 唯此神文不破, 练就内生性处理的终极大法!73.搞懂因果推断中内生性问题解决方法必读的书籍和文献已搜集好!74.2020年博导圈流传最广的一份“几十种内生性处理方法及其要求和局限”的宝典, 并附上代表性重要文献!75.因变量和内生变量是连续,有序和无序多元变量时, 该如何做工具变量估计?76.太难了! 用天气做工具变量IV都被审稿人质疑! IV竟如此脆弱那有什么IV选取建议呢? 77.天气数据作为工具变量IV的文献清单, 分门别类地为各位整理好了!78.华人金融学术女神为运用工具变量估计方法做因果推断的学者提供了如下宝贵建议!79.你确定找到一个好的工具变量了吗? 这将是一篇最值得你看的文章!80.关于工具变量估计的论证思路,各种检验, 操作代码和实证解读, 这可能是最全面的一份兵法!81.几百年一遇的工具变量让基于OLS的截面数据回归结果发到Top了, 设计巧妙让人叹服!82.一份使用工具变量回归的AER文章清单, 思路惊奇定会让你脑洞大开!83.引力模型基础上的工具变量如何构建?84.使用千年难得的IV+DID方法将中国故事写到了Top5, 设计之巧妙构思之缜密让人叹服不已!84.最全利用工具变量控制内生性的步骤和代码—在经管研究中的应用,85.避免用内生变量的滞后项作为工具变量,86.Bartik工具变量是什么? 份额移动法IV应用越来越多,87.避免用内生变量的滞后项作为工具变量,88.GMM和工具变量在面板数据中的运用, 一篇文章学会操作流程!

正文

计量经济学在进行政策效应评估时一般采用两个思路一「虚拟变量法」「工具变量法」
虚拟变量法是将政策变量作为外生变量进行处理,用虚拟变量的系数近似政策效应,该方法因估计简单且简洁明了,在早期的政策效应评估中应用较多,但其隐含一个重要假定,即虚拟变量是外生的,并且与误差项是相互独立的。在实际情况中,个体的经济决策以及经济运行系统存在的复杂性均决定了政策变量并非外生,会表现出明显的内生性。所以,在存在内生性问题的条件下,「虚拟变量不适用于政策效应评估」
工具变量(IV)作为计量经济学中重要的估计方法之一,可有效「解决内生性问题」。工具变量必须与内生解释变量具有高度的相关性,否则会导致弱工具变量问题,进而使估计量出现不一致性( Staiger和Yogo,2005)。所以,选择合适的工具变量至关重要,现有文献也基本集中于工具变量选取的研究。对于工具变量的选择问题,最早可追至 Andrews(1999)提出的广义矩估计中矩条件的选择问题, Donald和 Newey(2001)主要研究了在包含内生解释变量的线性回归模型中如何选取工具变量,提出了针对该类模型的最优工具变量选择标准,为工具变量的选择问题提供了基本模式;okui(2009)基于 Donald和 Newey(2001)方法,提出了动态面板模型中最优工具变量的选择标准。虽然这些方法存在一些不足,但却为工具变量问题的研究提供了重要息示甚至灵感。具体的,现有文献中选择的工具变量主要有以下几个方面。

将聚集数据作为工具变量

Card和 Krueger(1996)为了解决同效应( peer effect)的内生性问题,将州、郡等分析层面的集聚数据作为学校、班级以及邻里等层面解释变量的工具变量。Evans等(1992)在研究学校贫困生比例是否对学生怀孕或辍学具有显著影响的实证过程中,为学校贫困生比例选取的工具变量为失业率、贫困率以及家庭收入中位数,认为这三个因素必然与学校贫困生比例有关,但却不直接影响学生怀孕或辍学等行为;Bentolima等(2010)将联邦就业率作为“使用社会关系”的工具变量,以考察其对个人收入的影响效应,其理由是:联邦就业率与收入之间并未存在直接关系,但如果就业率较高,则在联邦内利用关系求职的必要性相对较低。虽然将集聚数据作为工具变量会克服内生性问题,但由于无法保证集聚数据具有完全外生性,所以可能会引入噪音,甚至导致遗漏偏误( Grogger,1996; Rivkin,2001),所以,使用该类工具变量的研究呈减少趋势。

将自然现象作为工具变量

通常认为在一定的区域范围内,河流、降雨、自然灾害等现象具有高度的随机性、外生性等特征,可被假设为与个人、群体的异质性无关,但与此同时又会影响某些社会过程。
Hoxby(2000)将区域内的河流数量作为学校数量的工具变量,用于验证学区内学校之间的竞争能否提高教学质量。由于历史积累的某种特征可能会导致学校数量存在内生性,而将河流数量作为学校数量的工具变量具有很强的说服力,即河流数量发的交通问题会直接影响学校的设立数量,而河流是自然形成,其与教学质量并无直接关系; Culter和 Glaeser(1997)同样将河流数量作为邻里区隔的工具变量,考察邻里之间的区隔程度对居住者产生的影响。
该工具变量的合法性体现在,河流越多必将导致邻里之间的区隔程度越严重,但河流数量却与居住者的收入无关。此外,除了河流,经济学家还将其他自然现象作为工具变量进行实证研究。Munshi(2003)在研究国际移民的问题中,将移民数量的工具变量设定为墨西哥移民来源地的降水量,用于考察移民数量与其收入之间的关系。
选取移民来源地的降雨量作为工具变量有其合理性,墨西哥某地区的降雨量与美国的劳动力市场并未存在任何联系,但却与该地区的农业收入息息相关,通过影响农业预期收入进而影响移民政策; Cipollone和 Rosolia(2007)试图考察意大利班级学生的性别构成对女生成绩会产生何种影响,为高中班级性别构成选取的工具变量是地震导致的男性免征兵政策,因为地震作为自然现象是随机且外生的;陈云松(2012)将中国农民工来源村庄的自然灾害程度作为外出打工者数量的工具变量,分析了同村打工网的规模与农民工收入之间的关系。
工具变量选取的合法性在于,自然灾害越严重,外出打工的村民越多,在控制地区间应对自然灾害能力以及来源省份之后,自然灾害可被视为外生的。

将生理现象作为工具变量

人类的生老病死这一生理上的自然历程,既具有随机性,又与特定的经济社会紧密相关,所以,经济学家将其作为工具变量,巧妙地运用在因果推断中。
Angrist和 Evans(1998)试图分析家庭中孩子的数量对母亲就业的影响效应,但由于孩子数量可随机选取,导致解释变量存在内生性,为了解决该问题,巧妙地运用人类生育行为中对儿子、女儿偏好的特征,将子女中的“老大”和“老二”的性别组合情况作为孩子数量的工具变量,认为孩子性别是完全随机的,如果前两个孩子是同性别双胞胎的话,会提高生第三个孩子的可能性,从而增加孩子数量; Acemoglu等(2001)将殖民地国家的自然死亡率作为该国制度的工具变量,他认为,如果某国的死亡率较高,那么殖民者就相对不愿留在该国,并在当地建立具有掠夺性的制度。由于制度存在路径依赖,殖民时代的制度与当代的制度具有密切联系,将历史上的自然死亡率作为工具变量,虽然与当今制度相关,但与目前的人均收入并不存在直接关系; Maurin和 Moschion(2009)分析了法国邻里中其他母亲的就业对单身母亲就业的影响。为了解决内生性间题,将邻里前两个子女的性别组合作为邻里母亲就业的工具变量,认为这两个变量之间存在直接关系,但邻里子女的性别组合是随机的,并不能直接决定单身母亲的就业。
Bentolila等(2010)将年长的兄弟姐妹数量作为使用社会关系的工具变量,认为兄弟姐妹的数量是随机的,但如果兄弟姐妹的数量越多,社会关系网就越大,那么使用社会关系进行求职的可能性也相对越大。

将社会空间作为工具变量

社会空间包括地理空间、市场空间等,其在特定的分析层面上具有随机独立性,但却与人类行为及其社会结果密切相关。Card(1995)在分析教育是否能够增加个人收、提高个人地位的研究中,由于教育具有随机性,所以将其作为解释变量会产生内生性问题,家到大学的距离会在一定程度上影响是否上大学的决定,但其作为城市空间要与个人的社会经济结果并无直接关系,所以将调查对象家到最近大学的距离为教育的工具变量。但地理空间的距离对上学意愿的影响比较微弱,或者只影部分人的决定,从而导致弱工具变量与局部预效应问题;al和n(199在其制度分析的研究中,将各国到赤道的距离作为工具变量,显然、该距离是外生的,但可大致反映各国受西方制度影响的程度。除了社会空间要素,市场要素也会与某些现象紧密联系,但却不直接影响个体的具体社会特征。
Qian(2008)在考察家庭收入性别结构与中国家庭男女出生性别比例关系的研究中,根据茶叶价格的提高可巩固女性的经济地位,进而降低家庭女胎被流产的几率,而茶叶的价格与家庭男女出生性别比例之间并不存在直接的逻关系,所以将茶叶价格作为家庭收入性别结构的工具变量。

将实验作为工具变量

实验作为一种外来干预,虽然会对被考察的解释变量产生冲击,但是却可置身模型之外,从而为实证研究提供工具变量,其中包括政策干预、改革创新等社会实验。
Angrist(1990、1993)、 Angrist等(1996、2010)陆续考察了越南战争期间,美国青年服兵役对当年的参战者和今天的退伍老兵在收入、健康及后续教育方面产生的影响。由于是否服兵役取决于生日抽签,小于某一國值则参加兵役,大于该國值则可免于兵役,而抽签则是完全随机的,但却对是否服兵役具有直接影响,所以将抽签号作为工具变量。Boozer和 Cacciola(2001)考察了班级平均成绩是否对个体成绩具有同侪效应,将班级中参与小班实验的人数比例作为班级平均成绩的工具变量。认为小班实验是学校从各班随机抽取人员组成,是随机且外生的,但小班教育在提高这部分学生成绩的同时必然会影响班级的平均成绩; Bohonis和 Finan(2008)采用类似的方法研究了墨西哥教育情况。将参与国家给生活困难的母亲补助项目的比例作为平均儿童人学率的工具变量,用于分析同龄人的入学率是否会对个体入学决定产生影响。
章元和陆铭(2009)分析了农民工社会关系网与收入之间的关系,将农民工祖辈的社会背景是否来自老区作为社会关系网的工具变量,认为两者之间具有直接联系,但该关系并不会影响农民工在外地的收入。
方颖和赵扬(2011)在各地产权保护制度对经济增长影响的研究中,将1919年中国不同城市基督教初级教会小学注册人数占当地人口比例作为工具变量,主要原因是,该比例可在一定程度上代表在历史上该地区受西方影响的程度,入读教会小学的比例越高,表明该地区受西方影响越大,建立产权保护制度的意识较强,而建立教会小学的初衷是布道,与经济发展水平并不直接相关。
工具变量方法功能强大且简洁明了,但其本身存在的局限性在一定程度上限制了该方法的推广:
(1)工具变量的选择存在很大困难,在政策效应评估的过程中,找出合适的工具变量非常不容易。在实际操作中,在能够获得政策实施前后数据的情况下,研究者通常将因变量的滞后变量作为工具变量,可能会导致相关性,无法从根本上解决内生性问题;
(2)工具变量的随机外生性无法用统计方法进行验证,其合法性容易被质疑,若提供不出有力证据,则后续实证分析将完全失去说服力;
(3)工具变量对样本往往具有非均质的影响导致估计量带有权重性特征,使得到的结论仅适用于一部分样本,降低了科学分析的政策意义( Deaton,2010)。
在使用工具变量方法时,应持审慎的态度,清楚说明所需假设前提,并指明一无法满足工具变量的外生性假设时,估计量将如何偏移,只有将理论党与前人的经验教训进行充分结合,工具变量方法才能为因果推断与政策评提供更强的说服力以及更高的可信度。
Source:《微观计量方法在公共政策效应评估中的应用研究》;作者: 刘志红  

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

2.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存