查看原文
其他

斯科特·坎宁安的《因果推断》新书即将上市

李井奎 奎星楼笔记 2022-12-31


     译者按: 我2020年在哈佛访学期间,曾旁听过哈佛大学的一些计量经济学课程,当时就已经注意到这本书的作者在其网站上所放的本书的初稿。在于2020年底了解到此书将由耶鲁大学出版社在2021年初出版时,我写信给作者,并提出了翻译成中文的建议,作者显然很高兴,慨允了这桩译事。之后,我把这本书推荐给中国人民大学出版社的王晗霞编辑,她很重视此书,遂于2021年上半年引进了这本书的中文版权,并交由我来翻译。


十多年前参与翻译《基本无害的计量经济学》时,我当时还并没有产生对计量经济学的浓厚兴趣,那本书的主要工作是郎金焕博士在负责。与《基本无害的计量经济学》那本书的译事不同,这本书翻译中的所有问题,我都可以为它负责。

在本书的翻译过程中,一方面也为了确保翻译质量,另一方面也出于培养我的学生的目的,在我原来在浙江财经大学所带的研究生中,我挑选了两个勤奋好学而且具备了一定计量经济学基础的同学——他们是浙江财经大学经济学院的梁真同学和平福冉同学——一起参与讨论译稿,对译文进行二校。在这个过程中,两位同学进步神速,这种表现也体现在了他们各自的论文工作中。正是这个过程,让我认识到,因果推断的技术方法,大大缩短了国际国内一流名校与普通院校学生在学术资源和方法上的距离。试想,在十多年前,计量经济学方法和因果推断工具尚未获得普遍接受的时候,学术研究基本上不太可能由一些普通院校的研究生来完成。高深的数理经济学方法以及学术资源高度垄断在部分名校手中,使得许多其他院校的师生没有许多机会能够参与到经济学的学术研究工作中去。但因果推断方法的兴起,推翻了这种局面,从这个意义上讲,我认为这套方法首先带来的是我们经济学普通学术工作者的福音。

因果推断方法既是困难的,也是有趣的。我2021年还出版了一本经济学科普著作《大侦探经济学:现代经济学中的因果推断革命》,这本书以一种相对轻松的笔调阐述了因果推断的工具,同时也对经济学家们在这个领域的工作做了通俗的介绍。有兴趣的读者,可以在学习本书感到艰难时,读一读那本书,进一步增强自己的兴趣和信心。

希望这本书能够有助于大家学习因果推断这一计量经济学方法,做有趣而严谨的经济学经验研究!

李井奎2022年3月写于浙江工商大学经济学院

以下为《因果推断》一书的“导论”部分选摘:

我走到经济学上来,路径颇为曲折。比如,我大学主修的并不是经济学。在大学期间,我甚至都没有上过哪怕一门经济学课程。由于Pete的缘故,我念的是英文专业。我的雄心是成为一名诗人。但是,即使没有随机实验,人们也能形成关于因果关系的合理信念,这一思想让我深感入迷。二十五年前,对于这句话在说什么,我甚至都不能理解,更不用说如何去做这样的实验了。那么,我是如何产生这样的转变的呢?可能你会想知道,我是怎么从当初那种状态,转变到今天使我能够撰写一部这样的书的。我从英文专业转到因果推断领域,一路走来风风雨雨,这个故事“太长,不会被人阅读(TL;DR 版本)”。首先,我爱上了经济学。然后,我爱上了经验研究。再接着,我发现,我对因果推断兴趣日渐浓厚,已然使我沉浸其中。不过,还是让我来讲一个更长的故事版本吧。

我在诺克斯维尔的田纳西大学主修英文,怀着一颗希望成为一名职业诗人的雄心毕了业。在大学时,我写诗颇有文名,但我很快认识到,这条路可能并不现实。当时我新婚燕尔,妻子身怀六甲,我是一名做市场研究的定性研究分析师。渐渐地,我完全停止了诗歌创作。

定性研究分析师的工作,使我眼界大开,其中一部分原因,是我平生第一次接触经验主义。我的工作是做“扎根理论(grounded theory)”——这是一种基于观察产生人类行为解释的归纳方法。我是通过组织目标群体(focus groups)并进行深度访问,以及通过其他人种学方法来开展这项工作的。我把每个项目当成一个机会,来理解人们为什么做他们现在在做的事情(即使他们做的不过是购买清洁剂或选择有线电视提供商这样的行为)。虽然这项工作启发我发展出了我自己关于人类行为的理论,但它并没有给我提供一种证伪这些理论的方法。

 我缺乏社会科学方面的背景知识,所以,我晚上会花时间从网上下载和阅读一些文章。我记不清是哪一天晚上,在我浏览芝加哥大学法律经济学工作论文网站时,加里·贝克尔(Gary Becker)的一个演讲引起了我的注意。这是他在诺贝尔奖颁奖典礼上发表的关于经济学如何应用于所有人类行为的演讲[Becker, 1993],这篇演讲改变了我的生活。我原以为经济学都是些关于股票市场和银行的知识,直到我读到那篇演讲,我才知道经济学是一个可以用来分析人类所有行为的工具。这真是令人无比兴奋,就这样,一颗种子在我心中已经播下。

但这颗种子却迟迟没有发芽,直到我读到Lott和Mustard [1997]写的一篇关于犯罪的文章,我才真正迷恋上了经济学。从他们的文章中,我认识到的经验部分是,经济学家试图用定量数据来估计因果效应。这篇论文的合著者之一David Mustard,当时是佐治亚大学(University of Georgia)的经济学副教授,也是加里•贝克尔(Gary Becker)从前的学生之一。我决定要跟着Mustard学习,所以我申请了佐治亚大学的经济学博士项目。于是,我就和妻子Paige以及尚在襁褓中的儿子(Miles)搬到了佐治亚州的雅典,并在2002年秋天开始了我的学习课程。

在通过第一年的综合考试后,我参加了Mustard的劳动经济学课程,学到了许多塑造了我长期兴趣的各种主题。这些主题包括:教育回报、不平等、种族歧视、犯罪,以及许多其他令人着迷的劳动方面的话题。在那些课程中,我们读了很多经验研究论文,后来我意识到,要完成所关心的研究,我需要有扎实的计量经济学背景。事实上,我也决定,把计量经济学作为我的主要研究领域。这推动了我与佐治亚大学的计量经济学和劳动经济学家Christopher Cornwell合作。我从Chris身上学到了很多,其中包括计量经济学以及研究本身。自然而然,他也成为了我的导师、合作者和亲密的朋友。

计量经济学是很难的。当时我也没有假装我很擅长它。为此,我修读了佐治亚大学所有的计量经济学课程,有些还不止一次。这些课程涵盖了概率与统计、截面数据、面板数据、时间序列和定性因变量等知识。尽管我通过了计量经济学的应试考试,但我还是非常努力去更为深入地理解计量经济学。正如俗谚所说:只见树木,不见森林。此时我虽然“衣带渐宽终不悔”,但始终还没有到“蓦然回首”的境界。

然而,当我在写博士论文的第三章时,我注意到了一些以前没有注意到的东西。我的博士论文的第三章,是一项关于堕胎合法化对所关注群体未来性行为的影响的研究[Cunningham and Cornwell, 2013]。这是对Donohue和Levitt[2001]的再探。为了准备我的研究,我读了Levine的一本书 [Levine,2004],其中除了讲堕胎的理论和实证研究外,还有一个小表格来解释双重差分识别策略。佐治亚大学采用的是传统的计量经济学教学法,而且,我的大部分专业课程都是理论性的(例如,公共经济学、产业组织理论),所以我从来没有真正听过“识别策略(identification strategy)”这个词,更不用说“因果推断”了。出于某种原因,Levine这一简单的双重差分表让我大开眼界。我看到,计量经济学模型可以被用来分离某一处理的因果效应,这导致我处理实证问题的方式发生了改变。

 

什么是因果推断?

我博士毕业后的第一份工作,是在德克萨斯州韦科市的贝勒大学(Baylor University)担任助理教授,我至今仍在那里工作和生活。我到了贝勒大学后就忙碌起来。我能感觉到,计量经济学是不可或缺的,但总觉得还有些东西被遗漏了。是什么呢?是因果关系理论。自从看到Levine [2004]的双重差分表以来,我就一直在研究这个理论。但我需要做的还不止于此。因此,失望之余,我做了我每次想学习新东西时都会做的事——我开设了一门关于因果关系的课程,强迫自己学习所有我不知道的东西。

我将课程命名为因果推断与研究设计(Causal Inference and Research Design),并于2010年首次向贝勒大学的硕士生进行讲授。当时,我找不到我要找的这类课程的例子,所以我拼凑了一些学科和作者的思想,比如劳动经济学、公共经济学、社会学、政治学、流行病学和统计学等学科。我的课不是纯粹的计量经济学课程;相反,它是一个经验研究类的应用课程,主要介绍诸如双重差分等各种当代研究设计方法,课上还要做经验研究复制以及大量阅读,所有这些都建立在唐纳德·鲁宾(Donald Rubin)和朱迪亚·珀尔(Judea Pearl)的著作中都有发现的关于因果关系的稳健理论上。这本书和那门课实际上非常相似。

那么,我如何定义因果推断呢?因果推断是由理论和对制度细节的深入了解共同撬动的一个杠杆,通过这一手段,我们得以评估事件和选择(events and choices)对我们感兴趣的结果所带来的影响。这不是一个新领域;自古以来,人类就痴迷于因果关系。但在实验室内外,我们在估计因果效应上的新进展,使这一领域呈现出了新的面貌。有些人认为,这种新的现代因果推断方法,肇始于Fisher (1935),Haavelmo(1943),或Rubin (1974)。有些人则把它与John Snow等更早期拓荒者的工作联系起来。在很大程度上,我们应该把它归功于上世纪70年代后期至90年代后期众多极富创造力的劳动经济学家,他们雄心勃勃的研究议程创造了一场延续至今的经济学革命。你甚至可以认为,我们应该感谢考尔斯委员会(Cowles Commission)、Philip.G. Wright、Sewall Wright,以及计算机学家朱迪亚·珀尔。

但是,不管我们如何定义其出现的年代,因果推断现在已经成长为一个独立的领域,自然而然地,你也开始看到越来越多关于它的处理方法。在计量经济学教科书中,有时会在“项目评估(program evaluation)”一章中对其进行冗长的回顾(Wooldridge,2010),有时甚至整本书都在作相关的论述。我们在这里仅列举几本教科书,在这一不断发展的领域,有Angrist和Pischke [2009],Morgan和Winship [2014],Imbens和Rubin [2015],也许还有很多其它的书籍,更不用说对特定策略的详细讨论了,如Angrist和Krueger [2001],Imbens和Lemieux [2008]等。实际上,市场上一直在悄悄地增加着有关使用数据识别因果关系的书籍和文章。

那么,为什么《因果推断:教学合集》(Causal Inference: The Mixtape)这本书还会有其一席之地呢?坦率地说,直到本书出现,市面上才有了一本融汇了编程示例、数据和详细解释,并且富有可读性的介绍性书籍。我的书就是在努力填补这个漏洞,因为我相信研究人员真正需要的是一本指南,使他们能从一无所知逐步达到胜任因果推断的境地。这意味着,他们能够识别哪些设计是可行或不可行的,这也意味着,他们能够获取数据,编写代码,利用理论和场景知识,在自己的项目中实现合理的设计。如果这本书能帮助人们做到这一点,那么这本书就有了存在的价值,而这正是我由衷期望的。

但是,我喜欢的那些书,以及那些启发了这本书的书,我为什么不继续使用它们呢?在我的课程中,我主要依靠Morgan和Winship [2014],Angrist和Pischke [2009],以及一个理论和实证文献库。在我看来,这些书是最权威的经典著作。但是他们并没有满足我的需要,因此,我需要不断地在材料间转换。其他的书都很棒,但对我来说也不是很合适。Imbens和Rubin (2015)涵盖了潜在结果模型、实验设计、匹配和工具变量,但没有包含有向无环图模型(DAGs)、断点回归、面板数据或合成控制等内容。Morgan和Winship [2014]涵盖了DAGs、潜在结果模型和工具变量,但以我个人的偏好来看,这本书对断点回归和面板数据着墨太少。这些书都未介绍合成控制法,而合成控制法被Athey和Imbens称为过去15年因果推断中最重要的创新[2017b]。Angrist和Pischke (2009)非常接近我的要求,但却没有包含任何关于合成控制法或图像模型这些在我看来非常有用的内容。也许,最重要的是Imbens和Rubin [2015], Angrist和Pischke [2009], Morgan和Winship[2014]都没有提供任何实用的编程指导,而我认为,我们在这些领域的知识,恰恰是通过复制论文和写研究代码获得的。

撰写这本书时,我考虑了不同类型的读者。它首先是为从业者(practitioners)写的,这就是为什么本书包含了可供下载的数据集和程序。这也是我花了大量时间尽可能多地复习论文、复制模型的原因。我希望读者能理解这个领域,同时,我也希望他们学有所得,学完本书能够使他们利用这些工具来回答他们自己的研究问题。

我心目中的另一类读者,是希望更新其知识的有经验的社会科学家。也许他们具有更多的理论倾向或背景,或者他们只是在人力资本上还有一些缺漏。我希望这本书能帮助他们了解社会科学中常见的现代因果关系理论,并提供了有向无环图模型的微积分表述,以帮助他们将理论知识与现实估计联系起来。对这群读者来说,我认为DAG模型尤其具有价值。

我关注的第三类人群,是行业、媒体、智库等领域的非学术人士。在这些职业领域,因果推断的知识越来越受到青睐。它不再仅仅是学者们坐而论道的东西。它也是作出商业决策和政策解释的重要知识。

最后,这本书也写给刚开启其职业生涯的人,无论他们是本科生、研究生还是刚毕业的博士生。我希望这本书能给他们一个全新的起点,这样他们就不必像我们这一辈的许多人那样,为了学习使用这些方法,在迷宫一般的道路上艰难摸索了。



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存