有趣的工具变量
一、内生性与工具变量
当回归方程中的解释变量内生时,直接使用 OLS估计的系数是有偏的。工具变量法是处理内生性问题的主要方法,为此我们寻找内生变量X的工具变量Z进行2SLS回归:
首先利用OLS估计:得到 的拟合值,
再使用 对 进行回归:,得到的无偏估计。
一般而言,工具变量至少满足两方面要求:
一是相关性:工具变量必须与内生变量相关;
二是外生性(排他性):工具变量只能通过内生变量这一渠道影响被解释变量。
工具变量的相关性很容易验证,而恰好识别时,工具变量的排他性无法直接检验。实际上,文章中关于排他性的论证不仅决定了工具变量的适用性,也很大程度上决定了一篇文章的好坏。
那么,如何“论证”工具变量的排他性呢?有以下几种思路:
一是定性分析。首先,工具变量的选取不是拍脑袋决定的,而是要在大量阅读相关文献并且在对背景知识十分熟悉之后才能确定。所以,作者往往在引言部分就会对工具变量选取的理由进行一番定性的描述,重点解释为什么文章中选取的工具变量对被解释变量没有直接的影响,其中会涉及许多历史背景知识,并辅以一些简单的数据说明。一篇好的文章,读者往往在读完引言之后,就已经相信了作者的故事。
二是加入控制变量。第二种方法是尽可能对工具变量可能影响被解释的变量的其他渠道进行讨论,加入一些可能与工具变量以及被解释变量相关的控制变量。假若工具变量真的通过这些其他渠道对被解释变量产生了影响,那么我们预期回归系数会发生较大改变;反之,则说明原先基础回归中的结果是稳健的。退一步说,哪怕真的存在工具变量不外生的情况,只要这种疑似的内生性不够大,我们仍然可以使用此工具变量。
三是证伪检验。证伪检验的思想是:假如第一阶段回归中工具变量的估计值等于零,并且工具变量又没有其他渠道可以作用于被解释变量,那么在 的直接估计方程中,其估计值也应该相应为零。
四是过度识别检验。当工具变量个数大于内生解释变量个数时,我们可以利用进行Sargan检验、Hansen J检验,判断工具变量的外生性。该检验的原假设为:所有的工具变量都是外生的。如果结果拒绝了该原假设,则说明至少有一个工具变量不是外生的。不过要注意的是:拒绝原假设只是表明存在着无效的工具变量,却无法告诉我们哪些工具变量是无效的。
(公众号:@Stata 连享会 厦门大学徐云娇;@计量经济圈 央财王存同教授)
二、一些经典的工具变量
因变量 | 内生变量 | 工具变量 | 文献 |
经济增长 | 政治制度 | 殖民时代的死亡率 | Acemoglu et al. (2001) |
产权保护制度 | 1919 年基督教小学人数 | 方颖&赵扬(2011) | |
政府效率 | 语言多样性 | Mauro (1995) | |
高速公路 | 最小生成树 | Faber (2014) | |
个人收入 | 受教育程度 | 学校建造的区域与时间差异 | Duflo (2001) |
家与大学的距离 | Card (1995) | ||
出生季度 | Angrist &Krueger (1991) | ||
文革是否上高中,距离 | Fleisher & Wang (2005) | ||
是否越战退伍军人 | 入伍抽签 | Angrist (1990) | |
劳动力流动 | 空气污染 | 空气流通系数 | 孙伟增等(2019) |
婴儿死亡率、学生出勤、心理健康、交通事故、肥胖 | 逆温强度 | Arceo et al. (2016); Chen et al. (2018); Chen et al. (2020); Sager (2019); Deschene et al. (2020) | |
犯罪、医疗成本、失眠、出行 | 风向与地理特征 | Herrnstadt&Muehlegger (2015); Barwick et al. (2018); Heyes & Zhu (2019); Chen et al. (2020) | |
居民健康 | 机场拥堵程度 | Schlenker&Walker(2015) | |
劳动供给 | 生育率 | 兄弟姐妹的性别构成 | Angrist& Evans (1998) |
教育、劳动供给 | 非婚生育率 | 双胞胎出现频率 | Bronars&Grogger (1994) |
学习成绩 | 班级规模 | 因最大班级规模造成的非连续性 | Angrist&Lavy (1999) |
学校数量 | 河流数量 | Hoxby (2000) | |
犯罪 | 警察 | 选举周期 | Levitt (1997) |
出生体重 | 母亲吸烟 | 州香烟税率 | Evans& Ringel (1999) |
内战爆发率 | 经济增长 | 降雨量 | Miguel et al. (2004) |
房价 | 住宅供应量 | 当地土地平坦度、湖泊数量 | Saiz (2010) |
市场分割程度 | 方言 | 当地戏曲种类 | 丁从明等(2018) |
(公众号:@phdhub2020;@计量经济圈;@经济聚能环)
1.制度影响经济增长的工具变量——殖民时代的死亡率
一直以来,经济学家都想找到地区间经济绩效长期差异的决定性因素。一些经济学家认为可能是制度(North, 1981; Acemoglu, Johnson and Robinson, 2001,2004),另一些则认为地理因素更为基本(Diamond, 1997; Sachs and Warner, 1995, 1997)。关键是,在实证研究中我们很难测度制度、地理对经济增长的边际贡献。我们可以说,好的制度可以促进经济增长,也可以说,经济增长为制度构建提供了良好环境,较发达的经济体往往可以提供更好的环境以促进制度向更优的方面发展。
为了解决这一“内生性”问题,学者们就需要为制度找到合适的“工具变量”,这一变量要同时满足:对“制度”而言具有相关性,对“经济增长”而言又具有外生性。然后,我们就看到一系列很有意思的工具变量陆续亮相了。
方颖和赵扬(2011)梳理了经济学家们既往不断寻找制度“工具变量”的过程。在西方历史中,不同的语言代表了不同的族源,从而有可能反映了不同制度的起源。Mauro(1995)利用这一差异作为各国腐败程度和政府效率的工具变量。Hall and Jones(1999)则把各个国家到赤道的距离作为制度的工具变量。他们认为到赤道的距离大致反映了各国受西方影响的深浅,从而可以反映不同制度的变化。但是,不少经济学家(Bloom and Sachs, 1998; Gallup, et al., 1998)认为各国到赤道的距离还同时通过气候和地理等因素影响到经济增长,从而不符合工具变量外生性的要求。
Acemoglu, et al. (2001) 选取殖民时期欧洲定居者的死亡率作为制度变量的工具变量,对现今人均收入进行 2SLS 回归,其中蕴含的逻辑是:如果早期殖民者在某地的死亡率较低,他们就倾向于向该地区移民,从而建立起仿效母国的制度。反之,如果死亡率较高,他们则倾向于在该地区建立掠夺性的殖民政府,尽可能将该地区的资源转移到母国。即使这些殖民地陆续获得了独立的权利,但由于制度的持续性,独立后的政府在很大程度上会延续原先坏的制度,从而对现今的人均收入产生负面影响。
但是 2SLS 结果的有效性依赖于工具变量的排他性约束——过去的定居者死亡率对现在的人均收入没有直接影响,于是,文章开始论证为什么这个假设是合理的。
(1)定性分析
一般说来,大家会担心欧洲定居者的高死亡率与现今的疾病环境有关联,从而对现在的经济表现有直接影响。但是作者指出,欧洲定居者的死亡病因往往是疟疾和黄热病,这些疾病虽然对欧洲人来说是致命的,但是由于当地成年人早就对这些疾病有了免疫力,当地人受到的影响非常有限,所以这种担心是不必要的。
(2)加入控制变量
文章控制了很多可能与定居者死亡率和经济产出二者都相关的变量,并且检验这些新加入的变量是否会影响文章的估计结果。具体来说,作者首先加入了与制度、经济表现密切相关的控制变量:代表殖民起源的虚拟变量、代表法律起源的虚拟变量和代表宗教的虚拟变量。回归结果显示,在加入这些虚拟变量后,对估计结果几乎没有影响,说明基础回归的结果是稳健的。
文章也控制了可能与死亡率相关的变量,比如气候和地理特征;此外,作者还加入了1975 年人口中欧洲后裔的比重以及民族语言的分裂,结果仍然稳健。
(3)过度识别检验
由于过度识别检验要求工具变量不止一个,所以作者在此部分又引入了代表欧洲人定居以及早期制度的一些工具变量。检验的步骤是:假设以上某个工具变量是真正外生的,在此基础上再加入定居者死亡率作为额外的工具变量,对这两种情况下2SLS的回归系数进行Hausman检验,看两组系数是否具有显著差异。结果表明,在 5% 的显著性水平下,均未能拒绝两组系数相同的原假设,所以定居者死亡率除了制度这一渠道外,没有其他渠道可以对人居收入产生影响。
另外,作者还提供了一个易于理解的过度识别假设:将想检验的工具变量Z直接放入因果效应方程,用其他工具变量作为内生变量的工具变量进行回归:。
如果定居者死亡率没有其他作用渠道的话,那就可以预期是不显著的。结果显示与预期相符合,这又增强了排他性约束成立的可能性。
(公众号:@Stata 连享会 厦门大学徐云娇)
2.奴隶贸易如何影响信任的工具变量——距海岸线距离
Nunn & Wantchekon (2011) 认为非洲历史上的奴隶贸易导致了人际间的不信任并延续至今,那些在奴隶贸易中受迫害越严重的种族的后裔们,越是对身边的亲属、邻居、政府等缺乏信任。
文章中的被解释变量——信任指标:是非洲民意调查中受访者报告的各种信任指标,核心解释变量——奴隶贸易指标:是受访者所在种族历史上奴隶出口的数量。
为解决二者间可能存在选择性偏差,作者选取奴隶贸易时期种族距海岸线的距离作为奴隶贸易指标的工具变量,很容易推知距海岸越近,种族被贩卖的奴隶数量越多。
在论证工具变量排他性约束方面,即距海岸线距离只能通过奴隶贸易这一唯一渠道影响信任,作者同样做出了许多努力,包括:定性分析、加入更多的控制变量以及证伪检验。由于前两个在殖民起源中已有所介绍,这里就主要介绍证伪检验。
文章中证伪检验的思路是:对于世界上其他没有经历过奴隶贸易的国家,由于它们第一阶段的关系不存在,所以距海岸线距离和信任之间的正向关系也不应该存在。用因果图表示如下:
于是,作者利用不存在奴隶贸易的样本对简约式进行估计,得到的估计结果均不显著,这表明我们没有找到距海岸线距离直接影响信任的证据,进一步证明了排他性约束的合理性。
(公众号:@Stata 连享会 厦门大学徐云娇)
3.空气污染影响肥胖的工具变量——逆温强度
空气污染不仅可以通过减缓新陈代谢等生物学途径影响体重,同时还能够从行为学途径影响体重,如减少人们的运动量及增加热量摄入等。然而,作者在识别空气污染与体重因果效应的过程中还面临着一个难题,即空气污染物属于经济活动的副产品,而收入、食品价格等经济因素同样是影响肥胖的重要因素,因此需要控制模型的内生性问题。
正常情况下,大气温度随高度增加而降低,热气上升冷气下降,污染物可以在大气中进行垂直循环。当逆温现象出现时,大气温度随高度增加而增加,污染物无法进行垂直循环,好似一床“棉被”盖在城市上空,空气污染就会加重,所以逆温强度与空气污染程度在理论上是正相关的。
由于逆温主要受大气环境的影响,与经济活动无关,并且能够直接影响空气污染水平,所以其作为空气污染的工具变量具有排他性、相关性等工具变量的特征。
(公众号:@经济聚能环 上海财经大学李兴)
4.高速公路影响经济发展的工具变量——最小生成树
中国政府于1992年开始实施“高速公路网”计划。对此,学术界就修建高速公路是否有助于边缘城市的发展并缩小区域间的经济不平等展开讨论。由于“修路”的决策具有“内生性”——被纳入高速公路网的边缘城市,与那些没有被纳入高速公路网的城市之间,可能原本就存在着各种各样的内在差异,“通过高速公路与中心城市连接”和“边缘城市经济发展”之间存在相关性关系,并不能推出修路促进了经济增长,有可能是中心城市本身就比边远城市有在政治地位、资源禀赋等差异造成的。
所以,问题的关键在于找到一个合适的“工具变量”:这个变量只通过影响“边缘城市被纳入高速公路网”的概率来影响“边缘城市的经济发展”,而与其他不可观测的影响经济增长的因素全部无关。
Faber(2014)独具匠心地利用算法中的“最小生成树”这一概念来构建工具变量,并由此估计修建高速公路的经济影响。他的主要思路是:给定一些确定的点(50万人口以上大城市,亦即“中心城市”)必须被纳入这个高速公路网,不考虑其他因素,理论上可以计算出一个对应的“最小生成树”(可以理解为一种铺设方案),使得铺设高速公路的总成本最低。
作为一个理性的决策者,在其他条件不变的情况下,肯定倾向于用这种成本低的方案。因此我们有理由相信,在其他条件不变的情况下,如果一个边缘城市的地理位置恰巧处于上述的“最小生成树”上,那么它最终被纳入实际的高速公路网的概率就比其他的边缘城市更高,而这种概率的差异又完全是由算法的结果客观地决定,不受其他人为因素的影响。
于是,作者以“边缘城市是否处于最小生成树上”作为工具变量,在因果推断的层面上估计出了高速公路对区域经济发展的影响。
(知乎网友:@冯路,财经院校在校学生)
5.科举废除对社会流动性和革命的影响——河流数量
Bai & Jia(2014)研究晚清废除科举对社会流动性和革命的影响,其基本逻辑是科举废除使得原本依赖于科举作为上升通道的知识分子不得不以参加革命的方式来完成社会阶层的流动,而这一效应在原本就教育发达,科举盛行的地方体现得更为显著。
为此,文章统计了有记载的同盟会等革命团体的成员的地域分布来说明这一点。文章主要是用科举名额来体现科举废除前各地通过科举实现社会流动的依赖性,而这个名额是以地域和对应人口来进行划分的。而且是非线性的不规则的划分。
文章在采用双差分法(DID)的基础上,为了避免遗漏变量的影响,必须找一个在科举废除前后都不变化而且跟科举名额有关的变量来做工具变量。两位作者的一个巧思是使用该地域内的小河流的数目,逻辑是县城一般是依河而建,小河流数基本上体现了县的数量,而科举名额与县的数量相关,且小河流的数量在科举废除前后并不变化。
(知乎网友:@Sean Ricky)
三、如何寻找工具变量
寻找到一个好的工具变量可以直接在MIT博士毕业,可见找工具变量是一件有挑战性的事情。在我看来,找工具变量是一项有趣的智力活动,除了需要一个人有经济学的素养和逻辑,还需要这个人知识面广,自然、地理、人文、世俗智慧和经验等,通常,这跟一个人熟悉的领域,与长期观察和思考产生的洞见有关。当然还需要一点运气,学术不是苦思冥想,也许做一个梦,喝一杯下午茶,灵感就闪现了。
当然,最重要的,在某个具体研究领域,了解前辈、同仁已有的认知、做法和探索,知己知彼,博采众家之长也不是什么坏事;有些时候,就是因为自己知道的太少了,做出来的东西就不够高大上和精致。陈云松(2012)提供了5种探寻工具变量的方向及其相关实例,列举如下:
1.来自“分析上层”的工具变量:集聚数据
经济学和社会学中一个非常热门的研究课题是同侪效应(peer effect)。其假说是,个人的经济社会结果,往往会受到所在集体的某个特征要素的影响。比如,一个人的成绩、收入、社会地位等等,会受到他所在的学校、班级、邻里的特征的影响。但要验证这一假说,我们就必须解决个人异质性导致的内生性问题。这是因为,很多无法观测到的个人、家庭因素,会同时和个人结果与我们关心的集体要素相关(特别是,个体往往根据自己的某项特质和偏好来选择学校、选择班级、选择邻居)。为解决这一内生性问题,经济学家和社会学家常常把州、县或大都会地区层面的集聚数据作为学校、班级和邻里等层面解释变量的工具变量(Card & Krueger,1996)。例如,埃文斯等(Evans et al.,1992)试图验证学校中的贫困生比例对学生怀孕或辍学行为是否有显著影响。他们运用大都会地区的失业率、家庭收入中位数和贫困率作为学校中贫困学生比例的工具变量。其理由是:以都会为单位的失业率和贫困率必然和辖区内学校的贫困生比例有关,但又不直接影响学生的怀孕或辍学等行为。邦托利阿等(Bentolila et al.,2010)使用联邦就业率作为工具变量来分析“使用社会关系”对个人收入是否具有作用。联邦就业率与收入没有直接关系。但就业率高,则在联邦内使用关系求职的必要性就低。不过,使用集聚层数据作为工具变量,往往会引入噪音,甚至增加遗漏偏误——因为我们无法保证高级区划层面上的特征值是完全外生的(Grogger,1996;Hanushek et al.,1996;Moffitt,1995;Rivkin,2001)。因此,这类工具变量的应用案例,在近年来的研究中有减少的趋势。
2.来自“自然界”的工具变量:物候天象
河流、地震、降雨、自然灾害等自然现象在一定地域范围内具有高度的随机、外生特性,因此可以被假设为与个人和群体的异质性无关,同时,它们又能够影响一些社会过程。例如,霍克斯比(Hoxby,2000)在一篇经典研究中,采用区域内河流数量作为该区域学校数量的工具变量,以此来验证学区内的学校竞争是否可以提高教学质量。区域内学校数量之所以是内生的,是因为它可能是该区域长期历史积累下的某种特征的结果。而使用河流数作为工具变量则具有很强的说服力:河流数量越多,就会因交通问题导致更多学校的设立;但河流数是天然形成的,本身和教学质量无直接关系。再如,卡尔特和克莱泽(Culter & Glaeser,1997)把贯穿大都市的河流数量作为邻里区隔的工具变量,以分析区隔程度对居住者的影响。该工具变量的合法性与上例工具变量异曲同工:河流越多,导致的邻里区隔程度必然越大,而河流数量和作为社会结果的居住者的收入无关。
除了河流,其他诸如地震、灾害、降雨量甚至化学污染等自然现象,都曾被具有社会科学想象力的研究者所使用。例如,在班级效应(class effect)研究中,西波隆和罗索利亚(Cipollone & Rosolia,2007)以地震导致的男性免征兵政策作为高中班级性别构成的工具变量,以分析意大利学生中班级性别构成对女生成绩的影响。地震作为一种天象,显然是随机和外生的。在国际移民研究中,孟希(Munshi,2003)则使用墨西哥移民来源地区的降水量作为移民数量的工具变量,证明了乡的移民越多,他们在美国打工的收入会越高。移民来源社区的降雨量作为工具变量的理由是:墨西哥某社区的降水量和美国的劳动力市场显然没有任何关联;但降水量和社区的农业收入有关,并通过影响农业预期收入而影响到移民美国的决策。在社会资本和网络效应研究中,陈云松(2012)以中国农民工来源村庄的自然灾害强度作为本村外出打工者数量的工具变量,证明了同村打工网络的规模直接影响农民工在城市的收入。使用自然灾害作为工具变量的合法性在于:灾害越重,外出打工的村民就越多;而在控制了地区间应对灾害的能力和来源省份之后,发生在村庄领域内的自然灾害可以被认为是外生的。
3.来自“生理现象”的工具变量:生老病死
人类的生老病死既是社会现象,也是生理上的自然现象。出生日期、季度、性别、死亡率等,虽仅仅是有机体的自然历程,但既具有随机性,又往往和特定的经济社会过程相关。因此,无论在宏观还是微观社会科学层面,它们都曾被巧妙地作为工具变量运用在因果推断之中。比如,在微观层面的研究中,个人的出生时段曾多次被作为工具变量使用。在教育回报研究中,安古瑞斯特和克鲁格(Angrist & Krueger,1991)把被访者出生的季度作为教育的工具变量。其理由是:上半年出生的孩子退学的可能性大于下半年出生的孩子(美国《义务教育法》规定不满16周岁不得退学),因此后者平均受教育时间更长。除了个体的“生日”,人类的生育结果也往往作为一种随机现象而被当作工具变量使用。例如,安古瑞斯特和伊凡斯(Angrist & Evans,1998)试图分析家庭中的孩子数是否影响母亲的就业。由于生育孩子数量是可以被选择的,因此解释变量显然是内生的。为解决这一问题,他们巧妙地挖掘了人类生育行为中偏好有儿有女的特征,将子女“老大”和“老二”的性别组合情况作为工具变量。理由是:头两胎如果是双子或双女,那么生育第三胎的可能性大大增加,进而增加子女数。而子女性别是完全随机的。莫林和莫斯基翁(Maurin & Moschion,2009)考察了法国邻里中其他母亲的就业如何影响单个母亲的就业。为了消解内生性问题,他们用邻里平均的头两个子女的性别组合作为邻里母亲就业的工具变量。理由是,邻里平均的头两个子女的性别组合,会影响到邻里内母亲的平均就业情况,而邻里的下一代性别结构是随机的,和单个母亲的就业决定没有直接关系。前文提及的邦托利阿等人(Bentolila et al.,2010)的研究,在使用联邦就业率作为“使用社会关系”的工具变量的同时,还使用年长的兄姊数目作为工具变量。他们的理由是,兄弟姐妹数是随机的自然现象,因为家庭育儿数字在法国是随机的。但兄弟姐妹越多,则社会关系越多,托人帮助求职的可能性也就越大。
4.来自“社会空间”的工具变量:距离和价格
社会空间的载体,包括具象性的城市、乡村,和非具象性的市场空间等,和人类的行为与社会结果息息相关,但往往又在特定分析层面上具有独立性、随机性。这类经典的工具变量分析案例,出现在教育回报研究中。卡德(Card,1995)使用被访者的家到最近的大学的距离作为教育的工具变量,以此来分析教育是否能增加个人的收入和地位。我们知道,教育作为解释变量之所以是内生的,是因为人们会选择上或不上大学。而从家到大学的距离,会影响到是否上大学这个理性选择。但这一距离,作为城市空间的要素,显然又与个体的社会经济结果没有直接关系。(当然,地理空间上的距离对于上学意愿的影响可能是微弱的,或者只影响到一部分人,即弱工具变量问题)。
在制度分析的研究中,豪尔和琼斯(Hall & Jones,1999)则非常具有想象力地用各国到赤道的距离作为工具变量。理由是,到赤道的距离大致反映了各国受西方制度影响的深浅程度,而这一距离显然是外生的。此外,除了城市距离这样具体的社会空间要素,市场作为社会经济活动的空间,其要素也往往和社会学家关心的现象紧密相关,却又不直接干扰个体的某些具体社会特征。钱楠筠(Qian,2008)巧妙地用茶叶的价格作为中国家庭中男性收入和女性收入之比的工具变量,证明了家庭收入的性别结构最终影响了中国家庭男女出生性别比例(传统上我们相信家庭的总收入影响男女出生比例)。用茶叶价格作为工具变量,是因为茶叶产业链的特性决定了从业人员以女性为主,茶叶价格提高就意味着女性在家庭中的经济地位提高,从而导致家庭女性胎儿被流产的几率降低。而茶叶的价格显然和家庭男女出生性别比例没有其他任何的因果逻辑联系。
5.来自“实验”的工具变量:自然实验和虚拟实验
实验是一种外来的人为干预。它一方面对我们关心的解释变量带来冲击,同时又会置身模型之外。能够给我们提供工具变量的实验,既有政策干预、改革创新这样的社会实验,又有假想的虚拟实验。不少研究采用外生性政策干预所带来的自然实验来挖掘适当的工具变量。这方面,工具变量权威安古瑞斯特有着极为经典的越南老兵系列研究。在越南战争期间,美国青年服兵役采取基于生日的抽签形式来决定。获得抽签号之后,小于一定“阈值”就去参加体检服兵役,大于阈值的则可免于兵役。抽签号的产生如同彩票一样是完全随机的,但又直接影响到是否服兵役这一重要的社会过程。利用各人获得的抽签号作为工作变量,安古瑞斯特等人从80年代末到今天的20多年间,做出了一系列经典研究,分析服兵役是否会对当年的参战者、今天退伍老兵产生在收入、后续教育及健康等方面的影响(Angrist,1990,1993;Angrist et al.,1996;Angrist et al.,2010)。(因为服兵役必然会减少教育年限,安古瑞斯特甚至尝试把抽签号作为教育的工具变量以分析教育回报,Angrist & Krueger,1992)。
在同侪效应研究中也可以使用自然实验方法。例如,布泽和卡乔拉(Boozer & Cacciola,2001)试图证明班级平均成绩对个体学业成绩具有同侪效应。他们把班级中曾经参与过“小班实验”的人数比例作为班级平均成绩的工具变量。其理由是:小班实验是随机设计的,学校之前从各个班级随机抽人去组成小班,因此外生性可以保证。而小班教学提高了这部分学生的成绩,故此对班级整体也必然有影响。类似方法还可参见博沃尔斯和菲南(Bobonis & Finan,2008)对墨西哥教育的研究。他们把村庄中参与Progresa项目(国家给生活困难的母亲以补助)的比例作为村庄儿童平均就学的工具变量,以此来分析乡村同龄人的入学率是否影响个体的入学决定。实际上,这一系列的工具变量思路来自于早前Angrist & Lavy(1999)关于以色列班级规模效应的经典研究:小班是否有利于学生提高成绩。他们采用的工具变量是所谓迈蒙尼德(Maimonides)规则下的本地招生人数。根据迈蒙尼德规则,凡是班级人数超过40的就会被分裂为两个小班。因此,招生人数和班级规模之间就存在一个紧密的非线性关系。更宏观社会空间层次的“自然实验”则是历史过程或大规模的社会运动。方颖、赵扬(2011)为估算各地区产权保护制度对经济增长的贡献,采用的工具变量是1919年中国不同城市基督教初级教会小学注册人数在当地人口中的比例。因为这一比例代表了该地区历史上受西方影响的程度:入读教会小学的人口比例越大,该地区受西方影响越大,也就越有可能在今天建立起较好的产权保护制度。而教会小学建立的初衷在于布道,这一变量和当年以及现在各地区的经济水平并不直接相关。在社会网分析中,章元、陆铭(2009)在分析农民工的家庭网、亲友网和收入之间的关系时,用农民工祖辈的社会背景及是否来自革命老区作为工具变量。其理由是,祖辈社会背景和是否来自老区会影响到农民工的社会网络规模,但这些历史因素和今天农民工在异地的收入没有其他直接联系。
虚拟实验则是一种非常有趣的工具变量方法,其原理有点接近于匹配方法。巴耶尔和罗斯(Bayer&Ross,2009)在研究就业是否存在邻里同侪效应时,为解决被访者个体异质性和自选择问题,他们用与被访者具有相同个人特征的其他被访者的平均邻里特征来作为被访者邻里特征的工具变量。其理由是,相似个体选择相似的邻里,那么基于类似者的平均邻里特征(也即工具变量)应该与被访者的邻里特征相关。而同时他们利用了控制变量是外生的这一标准假设:既然个体的可观测特征与未被观察因子无关,那么基于X的一组外生变量而生成的工具变量也就必然与个人异质性无关。孔特雷拉斯等(Contreras et al.,2007)采取类似的方法,发现邻里的非农就业对玻利维亚妇女获得非农工作具有正面影响。
找到好的工具变量非常之难,但难寻不该是不去尝试的理由。学习内生性问题和工具变量法时,必须将其置于一个具体的场景中,即在实战中学习,要针对一个具体的研究问题,寻找其产生内生性问题的具体原因和捕捉工具变量的具体契机。正如“纸上得来终觉浅,绝知此事要躬行。”总之,这是一个“格物致知”的过程,只有在不断地亲身实践中,才能深入地理解其中的道理,从中感悟到心得体会,从而真正得出“真知”!
(公众号:@陈云松(2012);@刘西川阅读写作课)