查看原文
其他

统计计量丨你不可不知的工具变量研究方法综述

刘志红 数据Seminar 2023-01-01

本文转载自公众号计量经济学服务中心

来源:《微观计量方法在公共政策效应评估中的应用研究》

作者:刘志红



计量经济学在进行政策效应评估时一般采用两个思路一虚拟变量法和工具变量法。虚拟变量法是将政策变量作为外生变量进行处理,用虚拟变量的系数近似政策效应,该方法因估计简单且简洁明了,在早期的政策效应评估中应用较多,但其隐含一个重要假定,即虚拟变量是外生的,并且与误差项是相互独立的。在实际情况中,个体的经济决策以及经济运行系统存在的复杂性均决定了政策变量并非外生,会表现出明显的内生性。所以,在存在内生性问题的条件下,虚拟变量不适用于政策效应评估。

工具变量(IV)作为计量经济学中重要的估计方法之一,可有效解决内生性问题。工具变量必须与内生解释变量具有高度的相关性,否则会导致弱工具变量问题,进而使估计量出现不一致性( Staiger和Yogo,2005)。所以,选择合适的工具变量至关重要,现有文献也基本集中于工具变量选取的研究。对于工具变量的选择问题,最早可追至 Andrews(1999)提出的广义矩估计中矩条件的选择问题, Donald和 Newey(2001)主要研究了在包含内生解释变量的线性回归模型中如何选取工具变量,提出了针对该类模型的最优工具变量选择标准,为工具变量的选择问题提供了基本模式;okui(2009)基于 Donald和 Newey(2001)方法,提出了动态面板模型中最优工具变量的选择标准。虽然这些方法存在一些不足,但却为工具变量问题的研究提供了重要息示甚至灵感。具体的,现有文献中选择的工具变量主要有以下几个方面



1、将聚集数据作为工具变量


Card和 Krueger(1996)为了解决同效应( peer effect)的内生性问题,将州、郡等分析层面的集聚数据作为学校、班级以及邻里等层面解释变量的工具变量。Evans等(1992)在研究学校贫困生比例是否对学生怀孕或辍学具有显著影响的实证过程中,为学校贫困生比例选取的工具变量为失业率、贫困率以及家庭收入中位数,认为这三个因素必然与学校贫困生比例有关,但却不直接影响学生怀孕或辍学等行为;Bentolima等(2010)将联邦就业率作为“使用社会关系”的工具变量,以考察其对个人收入的影响效应,其理由是:联邦就业率与收入之间并未存在直接关系,但如果就业率较高,则在联邦内利用关系求职的必要性相对较低。虽然将集聚数据作为工具变量会克服内生性问题,但由于无法保证集聚数据具有完全外生性,所以可能会引入噪音,甚至导致遗漏偏误( Grogger,1996; Rivkin,2001),所以,使用该类工具变量的研究呈减少趋势。



2、将自然现象作为工具变量


通常认为在一定的区域范围内,河流、降雨、自然灾害等现象具有高度的随机性、外生性等特征,可被假设为与个人、群体的异质性无关,但与此同时又会影响某些社会过程。Hoxby(2000)将区域内的河流数量作为学校数量的工具变量,用于验证学区内学校之间的竞争能否提高教学质量。由于历史积累的某种特征可能会导致学校数量存在内生性,而将河流数量作为学校数量的工具变量具有很强的说服力,即河流数量发的交通问题会直接影响学校的设立数量,而河流是自然形成,其与教学质量并无直接关系; Culter和 Glaeser(1997)同样将河流数量作为邻里区隔的工具变量,考察邻里之间的区隔程度对居住者产生的影响。该工具变量的合法性体现在,河流越多必将导致邻里之间的区隔程度越严重,但河流数量却与居住者的收入无关。此外,除了河流,经济学家还将其他自然现象作为工具变量进行实证研究。Munshi(2003)在研究国际移民的问题中,将移民数量的工具变量设定为墨西哥移民来源地的降水量,用于考察移民数量与其收入之间的关系。选取移民来源地的降雨量作为工具变量有其合理性,墨西哥某地区的降雨量与美国的劳动力市场并未存在任何联系,但却与该地区的农业收入息息相关,通过影响农业预期收入进而影响移民政策; Cipollone和 Rosolia(2007)试图考察意大利班级学生的性别构成对女生成绩会产生何种影响,为高中班级性别构成选取的工具变量是地震导致的男性免征兵政策,因为地震作为自然现象是随机且外生的;陈云松(2012)将中国农民工来源村庄的自然灾害程度作为外出打工者数量的工具变量,分析了同村打工网的规模与农民工收入之间的关系。工具变量选取的合法性在于,自然灾害越严重,外出打工的村民越多,在控制地区间应对自然灾害能力以及来源省份之后,自然灾害可被视为外生的。



3、将生理现象作为工具变量


人类的生老病死这一生理上的自然历程,既具有随机性,又与特定的经济社会紧密相关,所以,经济学家将其作为工具变量,巧妙地运用在因果推断中。Angrist和 Evans(1998)试图分析家庭中孩子的数量对母亲就业的影响效应,但由于孩子数量可随机选取,导致解释变量存在内生性,为了解决该问题,巧妙地运用人类生育行为中对儿子、女儿偏好的特征,将子女中的“老大”和“老二”的性别组合情况作为孩子数量的工具变量,认为孩子性别是完全随机的,如果前两个孩子是同性别双胞胎的话,会提高生第三个孩子的可能性,从而增加孩子数量; Acemoglu等(2001)将殖民地国家的自然死亡率作为该国制度的工具变量,他认为,如果某国的死亡率较高,那么殖民者就相对不愿留在该国,并在当地建立具有掠夺性的制度。由于制度存在路径依赖,殖民时代的制度与当代的制度具有密切联系,将历史上的自然死亡率作为工具变量,虽然与当今制度相关,但与目前的人均收入并不存在直接关系; Maurin和 Moschion(2009)分析了法国邻里中其他母亲的就业对单身母亲就业的影响。为了解决内生性间题,将邻里前两个子女的性别组合作为邻里母亲就业的工具变量,认为这两个变量之间存在直接关系,但邻里子女的性别组合是随机的,并不能直接决定单身母亲的就业。Bentolila等(2010)将年长的兄弟姐妹数量作为使用社会关系的工具变量,认为兄弟姐妹的数量是随机的,但如果兄弟姐妹的数量越多,社会关系网就越大,那么使用社会关系进行求职的可能性也相对越大。



4、将社会空间作为工具变量


社会空间包括地理空间、市场空间等,其在特定的分析层面上具有随机独立性,但却与人类行为及其社会结果密切相关。Card(1995)在分析教育是否能够增加个人收、提高个人地位的研究中,由于教育具有随机性,所以将其作为解释变量会产生内生性问题,家到大学的距离会在一定程度上影响是否上大学的决定,但其作为城市空间要与个人的社会经济结果并无直接关系,所以将调查对象家到最近大学的距离为教育的工具变量。但地理空间的距离对上学意愿的影响比较微弱,或者只影部分人的决定,从而导致弱工具变量与局部预效应问题;al和n(199在其制度分析的研究中,将各国到赤道的距离作为工具变量,显然、该距离是外生的,但可大致反映各国受西方制度影响的程度。除了社会空间要素,市场要素也会与某些现象紧密联系,但却不直接影响个体的具体社会特征。Qian(2008)在考察家庭收入性别结构与中国家庭男女出生性别比例关系的研究中,根据茶叶价格的提高可巩固女性的经济地位,进而降低家庭女胎被流产的几率,而茶叶的价格与家庭男女出生性别比例之间并不存在直接的逻关系,所以将茶叶价格作为家庭收入性别结构的工具变量。



5、将实验作为工具变量


实验作为一种外来干预,虽然会对被考察的解释变量产生冲击,但是却可置身模型之外,从而为实证研究提供工具变量,其中包括政策干预、改革创新等社会实验。Angrist(1990、1993)、 Angrist等(1996、2010)陆续考察了越南战争期间,美国青年服兵役对当年的参战者和今天的退伍老兵在收入、健康及后续教育方面产生的影响。由于是否服兵役取决于生日抽签,小于某一國值则参加兵役,大于该國值则可免于兵役,而抽签则是完全随机的,但却对是否服兵役具有直接影响,所以将抽签号作为工具变量。Boozer和 Cacciola(2001)考察了班级平均成绩是否对个体成绩具有同侪效应,将班级中参与小班实验的人数比例作为班级平均成绩的工具变量。认为小班实验是学校从各班随机抽取人员组成,是随机且外生的,但小班教育在提高这部分学生成绩的同时必然会影响班级的平均成绩; Bohonis和 Finan(2008)采用类似的方法研究了墨西哥教育情况。将参与国家给生活困难的母亲补助项目的比例作为平均儿童人学率的工具变量,用于分析同龄人的入学率是否会对个体入学决定产生影响。章元和陆铭(2009)分析了农民工社会关系网与收入之间的关系,将农民工祖辈的社会背景是否来自老区作为社会关系网的工具变量,认为两者之间具有直接联系,但该关系并不会影响农民工在外地的收入。方颖和赵扬(2011)在各地产权保护制度对经济增长影响的研究中,将1919年中国不同城市基督教初级教会小学注册人数占当地人口比例作为工具变量,主要原因是,该比例可在一定程度上代表在历史上该地区受西方影响的程度,入读教会小学的比例越高,表明该地区受西方影响越大,建立产权保护制度的意识较强,而建立教会小学的初衷是布道,与经济发展水平并不直接相关。

工具变量方法功能强大且简洁明了,但其本身存在的局限性在一定程度上限制了该方法的推广:(1)工具变量的选择存在很大困难,在政策效应评估的过程中,找出合适的工具变量非常不容易。在实际操作中,在能够获得政策实施前后数据的情况下,研究者通常将因变量的滞后变量作为工具变量,可能会导致相关性,无法从根本上解决内生性问题:(2)工具变量的随机外生性无法用统计方法进行验证,其合法性容易被质疑,若提供不出有力证据,则后续实证分析将完全失去说服力;(3)工具变量对样本往往具有非均质的影响导致估计量带有权重性特征,使得到的结论仅适用于一部分样本,降低了科学分析的政策意义( Deaton,2010)。

在使用工具变量方法时,应持审慎的态度,清楚说明所需假设前提,并指明一无法满足工具变量的外生性假设时,估计量将如何偏移,只有将理论党与前人的经验教训进行充分结合,工具变量方法才能为因果推断与政策评提供更强的说服力以及更高的可信度。




点击阅读原文进入CCAD数据库



·END·


星标⭐我们不迷路!

想要文章及时到,文末“在看”少不了!


点击搜索你感兴趣的内容吧


往期推荐


能解决80%分析难题:贝叶斯定理你必须要学会!

推荐丨李伯重:历史上的经济革命与经济史的研究方法

机器学习丨搞定贝叶斯公式,只需记住这5个字

数据呈现丨用python如何画出好看的地图

统计计量丨计量经济学主要刊物、软件、经济数据网站汇总

推荐丨洪永淼、汪寿阳:数学、模型与经济思想

数据资源丨干货!100个权威经济金融网站,果断收藏!




数据Seminar




这里是大数据、分析技术与学术研究的三叉路口



文丨计量经济服务中心

推荐丨青酱


    欢迎扫描👇二维码添加关注    

点击下方“阅读全文”了解更多

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存