2019诺贝尔经济学奖获得者学术贡献10000字长文
凡是搞计量经济的,都关注这个号了
邮箱:econometrics666@126.com
所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.
近二十年来,世界各地人民生活水平明显提高。1995年至2018年间,最贫穷国家的经济福祉(以人均国内生产总值衡量)翻了一番。儿童死亡率比1995年减少了一半,上学儿童的比例从56%增加到80%。
尽管取得了这些进展,但仍然存在巨大的挑战。7亿多人仍然靠极低的收入生活。每年仍有500万儿童在5岁前死亡,这些儿童往往死于通过相对廉价和简单的治疗便可以预防或治愈的疾病。世界上有一半的儿童仍然没有基本的识字和计算能力就离开了学校。
缓解全球贫困的新途径
为了消除全球贫困,我们必须确定最有效的行动方式。今年的获奖者们展示了如何通过将全球贫困问题分解为一些个人或群体层面上更小但更精确的问题来解决全球贫困。然后,他们用一个特别设计的田野实验(field experiment)来回答分解的每一个问题。在短短的二十年里,这种方法彻底改变了发展经济学领域的研究。这项新的研究正在产生稳定的具体成果,有助于缓解全球贫困问题。
长期以来,人们一直意识到富国和穷国的平均生产率存在巨大差异。然而,正如Banerjee和Duflo所指出的那样,生产力不仅在富国和穷国之间存在差异,而且在穷国内部也有很大的差别。一些个体或公司使用最新技术,而另一些(生产类似商品或服务的)使用过时的生产手段。因此,低平均生产率主要是由于一些个体和公司落后造成的。但这是否反映了信贷不足、政策设计不当,或者人们发现很难做出完全理性的投资决策?今年获奖者设计的研究方法正是针对这些类型的问题。
在学校里早期的田野实验
这些获奖者的第一次研究考察了如何处理与教育有关的问题。哪些干预措施以最低的成本提高教育效果?在低收入国家,教科书稀少,孩子们常常饿着肚子上学。如果有更多的教科书,学生的成绩会提高吗?还是给他们免费的学校餐更有效?上世纪90年代中期,为回答这些问题,Kremer和他的同事决定将他们的部分研究从美国东北部的大学转移到肯尼亚西部的农村地区。他们与当地一个非政府组织合作进行了一些田野试验。
为什么研究人员选择使用田野实验?好吧,如果你想研究更多的教科书对学生学习结果的影响,例如,简单地比较各个学校接触教科书难易度状况是不可行的。这些学校可能在很多方面有所不同:较富裕的家庭通常会给孩子买更多的书,在这些真正只有很小部分贫穷孩子的学校,成绩可能会更好,等等。规避这些困难的一种方法是确保被比较的学校具有相同的平均特征。这可以通过让机会来决定将哪些学校放在哪一组进行比较来实现(Quasi-experiments方法都在做这个事情)。这是一个古老的见解,它是自然科学和医学长期实验传统的基础。与传统的临床试验不同,获奖者使用了田野实验,研究个人在日常环境中的行为。
Kremer和他的同事们选择了许多需要大量支持的学校,并将它们随机分成不同的小组。这些小组中的学校都获得了额外的资源,但资源形式不同,获得时间也不同。在一项研究中,一组人得到了更多的教科书,而另一项研究则检验了免费的学校膳食。因为机会决定了哪个学校得到什么,所以在实验开始时,不同组之间没有差异。因此,研究人员可以可信地将学习结果的差异与各种形式的支持联系起来。实验表明,无论是课本还是免费学校餐,都不会对学习效果产生任何影响。如果教科书有什么积极的作用,它只适用于最好的学生。
后来的田野实验表明,许多低收入国家的主要问题并不是缺乏资源。相反,最大的问题是教学不能充分适应学生的需要。在第一个实验中,Banerjee,Duflo等人研究了两个印度城市的学生补习辅导计划。Mumbai和Vadodara的学校获得了新的助教,他们将帮助有特殊需要的儿童。这些学校被巧妙地随机地分为不同的组,使研究人员能够可信地测量助教的作用。实验清楚地表明,在中短期内,帮助针对最弱的学生是一项有效的措施。
在肯尼亚和印度进行的这些早期研究之后,在其他国家进行了许多新的田野实验,重点放在卫生、获得信贷和采用新技术等重要领域。三位获奖者在这项研究的前沿。由于他们的工作,田野实验已成为发展经济学家研究扶贫措施效果的标准方法。
与理论相联系的田野实验
精心设计的实验是高度可靠的——它们具有内在的有效性(internal validity)。这种方法在传统的新药临床试验中得到了广泛应用,并有专门招募的参与者参与测试。研究的问题,往往是某一特定的治疗是否具有统计上显著的效果。
今年获奖者设计的实验有两个显著特点。首先,参与者在他们的日常环境中做出实际的决定,无论是在干预组还是在对照组。这意味着,例如,测试新政策的结果通常可以在现场得到应用。
第二,获奖者依靠的是一种基本的洞察力,即我们希望改进的许多方面(如教育成果)反映了许多个体的决定(如学生、家长和教师)。因此,可持续的改进需要理解人们为什么要做决定——决定背后的驱动力。Banerjee、Duflo和Kremer不仅测试了某个干预是否有效,还测试了原因。
为了研究激励、限制和激励参与者决策的信息,获奖者使用了合同理论和行为经济学,这两门学科分别于2016年和2017年获得经济科学奖。
一般化结果
一个关键问题是实验结果是否具有外部效度(external validity),换句话说,实验结果是否适用于其他语境。能否将肯尼亚学校的实验结果推广到印度学校?如果一个专门的非政府组织或一个公共当局实施一项旨在改善健康的特别干预措施,会有什么不同吗?如果实验性干预从一小群人扩大到包括更多的人,会发生什么?干预是否也会影响干预群体之外的个人,因为他们被挤出稀缺资源的使用范围,或者面临更高的价格?
这些获奖者还站在了外部有效性问题研究的前沿,并开发了考虑挤出效应和其他溢出效应的新方法。将实验与经济理论紧密联系在一起,也增加了结果一般化的机会,因为基本的行为模式往往与更广泛的背景有关。
具体结果
如下,我们提供了一些具体结论的例子,这些结论来自获奖者发起的研究类型,重点是他们自己的研究。
教育:
我们现在对许多贫困国家学校的核心问题有了清晰的认识。课程和教学不符合学生的需要。教师缺勤率高,教育机构普遍薄弱。(我想,中国有类似问题)
Banerjee,Duflo等的上述研究结果表明,即使在中期内,对相对较差一点的小学生定向支持也有很强的积极作用。这项研究是一个互动过程的开始,在这个过程中,新的研究成果与越来越大规模的支持学生的方案齐头并进。这些项目目前已惠及超过10万所印度学校。
其他田野实验调查了教师缺乏明确的激励措施和责任,这反映在缺勤率很高。提高教师工作积极性的一种方法是用短期合同聘用他们,如果他们有好的成绩,可以延长合同期限。Duflo,Kremer等人比较了在这些条件下雇用教师与通过减少每名长期雇用教师的学生人数来降低师生比的效果。他们发现,与教师签订短期合同的学生的考试成绩明显好于其他学生,但每名长期聘用的教师拥有较少的学生并没有显著影响。(我想,难怪高校也喜欢搞聘用制)
总的来说,这项新的、以实验为基础的关于低收入国家教育的研究表明,一般来说,额外资源的价值是有限的。然而,使教学适应学生需要的教育改革很有价值。改善学校管理和要求不履行职责的教师承担责任也是成本效益高的措施。
健康:
一个重要的问题是医疗和保健是否应该收费,如果是,应该收费多少。Kremer和他的合作者进行了一项田野实验,研究了价格对寄生虫感染驱虫丸需求的影响。他们发现,75%的父母在药物免费时给他们孩子服用这些药丸,而当他们的药价低于1美元时,这一比例仅为18%,尽管得到大量费用补贴。随后,许多类似的实验也发现了同样的问题:穷人对预防性医疗的投资极其敏感。(我想,穷人有病都能拖就拖,更不要说去做做年检什么的)
低服务质量是贫困家庭在预防措施上投入如此少的另一个原因。一个例子是,卫生中心负责接种疫苗的工作人员经常缺勤。Banerjee,Duflo等人调查流动疫苗接种诊所(护理人员总在现场)是否可以解决这个问题。在随机选择进入这些诊所的村庄,疫苗接种率增加了2倍,从6%到18%。如果在给孩子接种疫苗时家庭得到一袋小扁豆作为奖励,这一比例将进一步增加至39%。由于流动诊所的固定费用很高,尽管扁豆的额外费用,但每次接种疫苗的总费用实际上减少了一半。
有限理性:
在疫苗接种研究中,激励措施和更好的护理并不能完全解决问题,因为61%的儿童仍然部分接种疫苗。许多贫穷国家疫苗接种率低可能还有其他原因,其中一个原因是人们并不总是完全理性的。这种解释也可能是其他观察的关键,至少在最初看来,这些观察很难理解。
一个这样的观察是,许多人不愿意采用现代技术。在一个设计巧妙的现场实验中,Duflo,Kremer等人调查了为什么小农户——特别是在苏萨哈兰非洲——不采用相对简单的创新,例如人工肥料,尽管它们会带来巨大的好处。一种解释是现在的偏见(present bias)——现在占据了很多人的意识,所以他们倾向于推迟投资决策。当明天来临时,他们再次面临同样的决定,并再次选择推迟投资。其结果可能是一个恶性循环,即个人不投资于未来,即使这样做符合他们的长期利益。(我想,穷人大多数比较短视,不敢冒险投资未来)
有限理性对政策设计具有重要意义。如果个人有现在的偏见(present bias),那么临时补贴比永久性补贴要好:这一提议只适用于这里,现在减少了推迟投资的动机。这正是duflo,kremer等人所说的。他们的实验发现:临时补贴对化肥使用的影响要比永久补贴大得多。(对大多数农民,不要承诺太长时间的政策,说今年、明年的政策就好)
小额信贷:
发展经济学家还利用田野实验来评估已经大规模实施的方案。一个例子是,各国大量引进小额贷款,这一直是人们非常乐观的根源。
Banerjee,Duflo等人对印度城市Hyderabad的一个以贫困家庭为重点的小额信贷方案进行了初步研究。他们的田野实验对现有小企业的投资存在相当小的积极影响,但他们对消费或其他发展指标却没有任何影响。类似的田野实验,在波斯尼亚和黑山、埃塞俄比亚、摩洛哥、墨西哥和蒙古等国也发现了类似的结果。
政策影响
获奖者的工作对政策产生了明显的直接和间接影响。当然,不可能精确地衡量他们的研究对各国政策的制定有多重要。然而,有时可以从研究到政策划出一条直线。
我们已经提到的一些研究确实对政策产生了直接影响。对补习辅导的研究最终为目前已惠及500多万印度儿童的大规模支助方案提供了论据。驱虫研究不仅表明,驱虫对小学生的健康有明显的好处,而且家长对价格非常敏感。根据这些结果,世卫组织建议,免费向生活在其中20%以上有特定寄生虫感染地区的8亿多学童分发药物。
也有粗略估计,有多少人受到这些研究结果的影响。其中一项估计来自两位获奖者帮助建立的全球研究网络(J-PAL);该网络研究人员评估后扩大规模的项目已达到4亿多人。然而,这显然低估了研究的总体影响,因为并非所有发展经济学家都隶属于j-pal。消除贫困的工作还包括不将资金投资于无效的措施。各国政府和各组织通过关闭许多用可靠方法评估并证明无效的方案,为更有效的措施释放了大量资源。
获奖者的研究也产生了间接影响,改变了公共机构和私人组织的工作方式。为了做出更好的决定,越来越多的与全球贫困作斗争的组织已经开始系统地评估新的措施,经常使用田野实验。
今年的获奖者在重塑发展经济学研究方面发挥了决定性的作用。在短短的20年里,这门学科已经成为一个繁荣的、主要是实验性的主流经济学领域。这项以实验为基础的新研究已经有助于减轻全球贫困,并具有进一步改善地球上最贫困人口生活的巨大潜力。
减轻全球贫困的实验方法
这一节描述了建立现代发展经济学方法的基石。我们首先讨论导言中强调的三个贡献。然后,我们简要讨论了主要的实证方法:随机对照试验。最后,我们来看看这个方法是如何使用的。
三大贡献
现代发展经济学的方法依赖于两个简单而有力的思想。一种观点是,以经济理论为指导的微观实证研究可以为有效扶贫政策的设计提供重要的见解。另一种是,得出真正因果关系精确结论的最佳方法往往是进行随机对照的现场试验。20多年来这些思想的系统运用,为发展研究的转型铺平了道路。
这一领域的改革需要几个不同的步骤,一些学者作出了重要贡献。然而,获奖者的三项贡献却十分突出。
首先,从20世纪90年代中期开始,Kremer和他的同事们在肯尼亚开展了一系列的田野实验,以理清教育生产函数的各个组成部分(Kremer2003)。从本质上讲,他的方法等于把如何促进人力资本积累的问题分解成更小、更易于管理的主题,每个主题都可以通过专门设计的随机对照试验进行严格研究。此后不久,Banerjee和Duflo——在许多情况下是与Kremer和其他合著者一起——扩大了教育主题的范围,并就其他几个主题展开了田野实验。这些研究在将新方法扩展到发展经济学的基本所有分支方面发挥了中心作用。此外,研究结果指出私营和公共部门存在重要的市场效率低下问题,并为解决这些效率低下问题的其他方法提供了证据。
其次,在一系列的贡献中,Banerjee和Duflo阐述了微观经济方法的知识案例,以帮助理解更广泛的(宏观经济)发展问题的各个方面(Banerjee和Duflo2005、2007、2011)。其中,Banerjee和Duflo在2005年发表的论文是一篇将微观经济发展问题与发展中国家的低总人均收入联系起来的关键概念性文章。这项工作的出发点是一项重要的经验观察:低收入和中等收入国家同一生产要素的回报率存在很大的不均匀性,利用有利可图的投资机会的程度也存在很大的差异。这种分配不当的程度可能严重到足以帮助解释低收入和高收入国家之间巨大的全要素生产率差距,这在实证增长文献中得到了强调。直观地说,当资源得到最佳配置时,经济将在其生产可能性边界上运行。当资源配置不当时,经济将在这一边界内运行:产出和生产率将低于预期。Banerjee和Duflo进一步认为,发展文献中记录的市场和政府缺陷——无论是政府失败、信贷约束、保险失败、外部性、家庭动态或行为问题——都有助于解释分配不当。因此,了解一些国家贫穷的原因的第一步是根据经验确定低效率的重要来源和解决这些问题的政策。《贫困经济学:彻底反思战胜全球贫困的方法》(Banerjee and Duflo 2011)又向前迈进了一步。根据一系列关于贫困成因的微观研究结果,Banerjee和Duflo吸取了经验教训,以科学为基础,致力于改善穷人的健康、教育和收入。
第三,通过设计新的实验研究方法,例如,应对外部有效性的关键挑战(Duflo 2004、2006a、Duflo、Glennerster和Kremer 2006、Banerjee和Duflo 2009),获奖者坚定地确立了新方法,并为新一代研究人员制定了明确的前进方向。在麻省理工学院的阿卜杜勒拉蒂夫贾米尔贫困行动实验室(j-pal)也是这项努力的关键所在,该实验室是Banerjee和Duflo与Sendhil Mullainathan(也是印度裔)共同创建的。J-PAL在许多国家促进了建立在随机对照试验基础上的研究,并促进了经济政策界对此类试验结果的接受。
评估因果效应
对于发展经济学研究的转变有一个重要的推动作用的,是建立和采用一个(更)连贯的微观经济学理论框架。另一个重要的推动因素是,其他经济学领域向实证研究的强烈转变,这些实证研究明确地设计用于可信地估计因果关系。这种所谓的基于设计的方法始于20世纪90年代初的劳动经济学家(见Angrist和Pischke 2010的概述)。但与最初的以设计为基础的方法(主要依靠自然实验)不同的是,新的微观经济发展研究在很大程度上但并非完全依赖于田野实验。
随机对照试验是评估某一干预或计划的因果影响的方法。本质上,它是为了回答反事实的问题:在没有项目的情况下,接触项目的个人的表现如何?相反,如果其他没有暴露在外的人有机会参与,他们将如何度过难关?这些问题的出现,是因为在任何给定的时间点,一个人要么暴露在项目中要么不暴露。这是“因果推理的基本问题”(Holland 1986)的一个例子:在给定的时间估计项目对个人的影响是不可能的。但是,可以通过将一组个体与未接触该方案的类似个体组进行比较来估计该方案对一组个体的平均影响。要做到这一点,需要一个可信的比较组:一组在没有该计划的情况下,其结果与接触该计划的人相似的人。但如何找到这样一个有效的比较组呢?
如果我们只是比较暴露在项目中的一组个体和由未暴露个体组成的一组个体,估计的差异有两个部分。一个组成部分是项目的平均因果效应。但估计的差异还将包括一个反映选择偏差的术语:在没有项目的情况下,两组之间反事实结果的差异。如果没有一种可靠的方法来估计或消除这种选择偏差,因果效应就无法可靠地估计。(这是因果推断研究小组一直在做的)
解决选择问题的一种方法是随机地将个体(或者更广泛地说是分析单位,如家庭、社区或学校)分配给一个处理组和一个对照组。如果一个单位作为随机抽签的结果属于这些组中的一个,那么组间唯一的系统性差异是通过暴露在处理方案中而产生的。当设计和实施正确时,随机对照试验允许研究人员以公正的方式估计某一干预措施的因果影响。
当然,随机对照试验在科学上有着悠久的历史。一个世纪前,农业研究人员开创了作物研究的先河。在战后,随机对照试验与临床试验和后来的医学领域试验密切相关。在经济学中,一些重要的随机对照试验早于发展经济学实验工作的爆发,包括负所得税实验(Hausman and Wise 1985),兰德健康保险实验(Newhouse 1993),1980年代和1990年代一系列福利改革的实验(Manski和Garfinkel 1992),以及教育研究,如Perry学前项目和Star项目(Schweinhart、Barnes和Weikart 1993)。因此,用于估计因果效应的主要方法并不新鲜。但是,正如我们接下来所描述的,随机对照试验在发展经济学中的应用已经显著地扩展了它的用途。
量化因果路径
获奖者倡导的方法依赖于经济学的一个基本观点:人们可能希望影响的大多数结果反映了个人做出的有目的的选择。因此,要持续地影响感兴趣的结果(也称为终点),必须了解驱动观察结果的选择,以及了解这些选择的机制。也就是说,我们需要确定激励、约束和信息的变化通过人类行为影响兴趣结果的因果路径。
例如,阻止疟疾、腹泻、肺结核和其他致命疾病威胁生命的疾病的知识主要是通过医学研究人员进行的随机对照试验收集的。尽管有这一既定的医学知识,低收入国家每年仍有数百万儿童死于可预防的疾病。因此,今天关于降低低收入国家儿童死亡率的讨论主要围绕人类行为展开。为什么没有提供或要求经过证明的廉价优质护理?为什么服务提供链中各个环节的提供者在工作中没有出现,或者没有表现出来?如何克服这些障碍?如果是这样的话,如何以成本效益高的方式提供可行的服务?这些问题是发展经济学家所采用的实验方法的核心。
对激励和约束的强烈强调是田野实验设计不同于更可控环境设计的一个重要原因。例如,根据设计和实际原因,双盲田野实验并不典型。就学校而言,如果家长知道额外的资源,增加额外的资源只能排挤他们的投资或努力。这些行为反应不仅是理解实验结果本身的核心,也是理解更广泛的人类行为的核心。事实上,对所谓的行为中点的关注,使得田野实验成为更为普遍的人类行为测试的有力工具。这些反应,以及它们与经济理论的联系,也可能揭示出更广泛的问题,而不仅仅是目前的实验性干预。
揭开机制
探索揭开机制也有助于解释为什么田野实验已成为该领域的主要经验方法。随机对照试验的独特之处在于不仅能让研究者完全控制分配机制,消除选择偏差,而且能控制政策处理本身。正如Duflo和Banerjee强调的那样(Duflo 2006a、Banerjee和Duflo 2009),传统的观察研究评估了世界上已经发生的事件。通过实验,学者可以操纵感兴趣的处理方法,创造出尚未观察到的事件。
这种设计灵活性具有许多优点。研究人员可以根据先前的知识或理论,测试他们认为可能有效的新政策或干预措施,即使目前没有决策者考虑实施这些政策或干预措施。此外,他们可以引入随机变化,从现有的理论测试预测。
此外,实验允许在相同的设置、相同的结果变量和相同的测量技术下进行透明的迭代研究过程。无论是准实验方法还是完全实验方法,实验工作通常都会提出重要的后续问题。但是,观察研究的后续行动受到了最初政策变化的限制,这些政策变化产生了最初的数据。控制实验本身的能力放松了这种限制,使研究人员能够从连续的多步骤实验中学习,在这些实验中,每一个新的步骤都需要前面步骤中结果的优点。正如duflo(2006a)所指出的,这种在固定环境和固定人群中的学习通常与实验室实验有关。然而,与其他经济学领域的大多数实验室实验不同,发展经济学领域的田野实验涉及在日常环境中做出重要选择的现实决策者。
最后,正如Kremer和Glennerster(2011年)所讨论的,规划和实施田野实验迫使研究人员接触并花时间了解实地的实际情况,经常与政府或非政府机构密切合作。这种基于场的方法允许感应发现新的机制和事实,超出现有模型所建议的那些。反过来,这种归纳可以帮助完善理论,提高我们设计更好政策的能力。
关于发展中国家与贫困作斗争的证据
这一部分追溯了发展经济学实验方法的思想史,重点放在一系列主题领域:教育、卫生、行为偏见、性别和政治以及信贷。这五个领域各有一个单独的小节,突出了获奖者的实质性贡献。
以下绝不是对获奖者研究的详尽介绍,更不是对五个主题领域的文献综述。然而,它阐明了Banerjee、Duflo和Kremer开创的实验方法如何实质性地改变了我们对发展中国家经济、社会和政治现象的实际认识,以及该领域的方法论方向。它还说明了在实地采取的减轻贫穷的广泛办法,从促进人力和物质资本积累的政策,通过旨在促进采用更好的技术的政策,到可以影响如何选择和执行影响穷人的政策的干预措施。此外,许多研究人员在大多数发展领域进行了一系列公认的微观经济研究。为了重新强调导言中的一点,获奖者的研究通过他们开创的实验方法改变了这个领域。
长按以上二维码可以读全文
下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。
2年,计量经济圈公众号近1000篇文章,
Econometrics Circle
数据系列:空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 | 夜间灯光 | 官员方言 | 微观数据 |
计量系列:匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 |
数据处理:Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |
干货系列:能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 |
计量经济圈组织了一个计量社群,有如下特征:热情互助最多、前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。