“反垄断”政策动向成为市场关注焦点。前有阿里被国家市场监督管理总局罚款182.28亿元,成为中国有史以来对垄断企业进行的最高罚款;随后美团也因涉嫌垄断的行为被立案调查;而上海市场监督管理局对某线上外卖平台涉嫌滥用市场支配地位行为的行政处罚书在朋友圈的刷屏,也使“计量经济学”这一原本仅在经济学、统计学等领域出没的专业术语意外“出圈”。
恰逢“格致方法·计量经济学研究方法译丛”新书《匹配、断点回归、双重差分及其他》面世之际,谨此分享译者朱保华为本书撰写的序言,其中对计量经济学在政策效果评估中的作用进行了介绍,相信对计量经济学感兴趣的读者会有所收获。
(本文为《匹配、断点回归、双重差分及其他》译者序,作者朱保华系上海交通大学安泰经济与管理学院教授、博士生导师。)通常,经济个体受到某种政策影响的事件可理解成经济个体受到了某种处理(treatment),政策效果评估也称为处理效应(treatment effect)评估。政策效果评估需要计算受到政策影响与没有受到政策影响的不同经济个体之间的核心观察变量的数值差异。由于政策效果评估大多使用经济个体的微观层面的面板数据,政策评估的计量经济分析也可理解成微观计量经济理论的一个分支。与侧重受限因变量分析的传统微观计量经济理论相比,政策评估的计量经济分析更注重自然试验思想与结构模型的结合,更多地从观察数据的视角考虑识别和估计不同因果效应的计量推断方法。
一般而言,将受到政策影响和没有受到政策影响的群体分别称为处理组和比较组,根据处理组与比较组的核心变量差异界定政策效应。利用微观个体数据进行政策效果评估面临着以下几个问题。第一,缺乏完全符合随机化要求的观察数据,无法同时观察到经济个体受到政策影响和没有受到政策影响的情形,只能按照一定假设条件虚拟预测经济个体的反事实结果,再根据实际观察到的结果与构建的反事实结果的差异界定政策效果。第二,由于政策效果可能受到政策自身以外因素的影响,存在影响政策效果评估的混杂因素干扰,需要使用必要的计量分析工具从各种混杂因素中剥离出真正需要的政策净效应。第三,经济个体之间存在不可观察的异质性,不可观察的异质性在政策结果预期方程中导致政策处理变量与随机扰动因素的相关性,出现解释变量的内生性问题。这种源于不可观测的经济个体的异质性导致的内生性经常需要工具变量的介入,进而对政策效果的识别与估计造成新的困难。既然社会经济政策难以使用模拟实验方法,为解决内生性问题就需要借助准实验(quasi experiment)方法,使用工具变量方法及基于工具变量方法的政策处理效应的估计方法。除了平均处理效应(average treatment effect on treated)外,局部平均处理效应(local average treatment effect)、边际处理效应(marginal treatment effect)和分位数处理效应(quantile treatment effect)等概念也广泛用于各种社会经济政策的评估问题。政策效果评估的计量经济分析工具一般包括了匹配、断点回归和双重差分等。匹配方法侧重于构建有效进行政策效果评估的处理组和比较组。使用匹配方法的重要前提假设是条件独立性,要求在控制各种共变量(covariate)之后,经济个体的处理效应结果不再受到是否接受处理决策的影响。条件独立性的简单处理方法是要求处理组与比较组的共变量具有相似的统计特征。在共变量较多的场合,不仅难以界定共变量群体的统计特征相似性,实际上也无法实现处理组与比较组的严格匹配,需要使用降低匹配维度的倾向匹配得分方法。倾向匹配得分方法需要估计倾向得分的函数,既可以使用参数化的倾向得分函数,也可使用非参数方法构建必要的匹配对象群体。由于不同匹配方法的选择可能影响政策效果的评估结论,自然需要针对不同政策效果评估问题寻找合适的匹配方法。为估计准实验的政策效应,断点回归方法将是否接受政策影响的概率理解成一个非连续函数。在选择变量(selection variable)与是否接受处理的决策之间存在确定性关系时,使用精确断点回归模型;在条件选择变量与是否接受处理的决策之间存在随机关系时,或者是一些不可观测的条件选择变量影响是否接受处理的决策时,使用模糊断点回归模型。双重差分方法是将政策实施前后的核心变量结果进行差分,再剔除存在于不同经济个体的共同时间趋势,从而得到政策效果的估计值。双重差分方法的主要优势是计算简便、可接受某种形式的选择性误差;其主要问题是要求不同比较对象之间必须保持相同时间趋势的假设条件,而且有时较难检验这个不太符合现实的假设条件。作为检验双重差分方法的前提假设是否成立的一种方法,可以考虑使用三重差分模型来讨论双重差分模型的前提假设条件是否得以满足的问题。既然政策评估倾向使用结构模型展开因果性分析,容易遭遇变量的内生性问题,需要使用解决变量内生性的工具变量方法,模糊断点回归模型的估计也可使用工具变量的估计方法。尽管工具变量的选择只需满足相关性和外生性的要求,但是针对特定问题的有效工具变量选择并非易事,还可能遭遇弱工具变量问题。因此。政策效果评估的计量经济理论对于有效选择工具变量的讨论深度似乎不如匹配问题在政策效果的评估中,更多的研究发现了即使控制了所有观测变量,政策对经济个体的影响依然因人而异,不可观察异质性似乎显得越来越重要,计量经济学家也开始关注政策效果分布或政策的分位数处理效应的识别与估计。目前,处理效应的多数研究还是只适用于单截面数据或两期数据,政策变量基本都是二值变量,需要将政策评估拓展到多期面板数据、连续取值的政策变量等动态处理效应模型。动态处理效应模型是针对分两阶段实施的政策,经济个体可在第二阶段开始前根据第一阶段的实现结果自由选择是否继续接受第二阶段政策的影响,此时第一阶段的实现结果将影响经济个体是否接受第二阶段政策影响的决策。由于政策效果评估的计量经济分析日益受到关注,也涌现了不少政策效果评估的计量经济学教材,各种教材也都反映了不同作者的特色。作为通识性教材,安格里斯特和皮斯克(Joshua D. Angrist and Jorn-Steffen Pischke)的《基本无害的计量经济学:实证研究者指南》(Mostly Harmless Econometrics:An Empiricist's Companion)和《精通计量:从原因到结果的探寻之旅》(Mastering's Metrics: the Path from Cause to Effect)的影响较大。安格里斯特和皮斯克的二本教材侧重使用知名事例说明因果性计量经济分析的基本思路与方法,较少讨论检验统计量等理论问题。涉及政策评估问题的一般的计量经济学教材较少,斯托克和沃森(James H.Stock and Mark W.Watson)的《计量经济学》(Introduction to Econometrics)比较详细地说明了政策项目评估所需的因果分析的基本知识,值得希望正确理解政策评估的计量经济分析问题的读者阅读。当然,国内也有学者撰写了因果分析的计量经济书籍,出现了赵西亮的《基本有用的计量经济学》、陈诗一和陈登科的《计量经济学》等书箱。在阅读了上述书籍的基础上,希望进一步提升因果分析的计量经济理论水平的读者,值得阅读李明宰(Myoung-jae Lee)的《匹配、断点回归、双重差分及其他》(Matching,Regression Discontinuity,Difference in Differences,and Beyond)。这本书主要讨论了政策效果评估的匹配方法、匹配样本选择、断点回归、双重差分与三重差分等问题,说明了不同方法的适用条件及实证应用。与其他同类书籍相比,本书的特点或许是政策效果评估的差分方法、简单的多期面板数据政策评估等。除了双重差分模型外,本书讨论了其他教材涉及较少的三重差分模型,说明了如何利用三重差分模型分析双重差分模型是否适用的问题。结合多重差分模型的讨论,本书也简单说明了如何利用三期以上的面板数据进行政策效果评估的问题。本书对于各种估计量的解释比较详细,提供了Gauss语言的程序,以综述的方式介绍了非参数统计分析的基础知识。总之,阅读本书既可以掌握政策效果评估的基本方法,也可以了解政策效果评估的部分研究动向。本书的作者李明宰属于较早撰写政策效果评估教材的学者之一。作者希望使用通俗易懂的文体说明政策效果评估的计量经济理论,本书既没有对各种数学公式进行编号,也没有使用不同字体区别表示标量和向量矩阵。尽管如此,读者还是容易地根据正文内容分辨出变量对应标量还是向量矩阵。此外,根据作者提供的勘误说明,中文版调整了几处的正文表述,修改了十四篇参考文献的引用格式,属于英文版的更新版。由于处理组与控制组等因果分析概念是从生物医学统计领域借鉴而来的,在不少生物医学的统计学著作中能见到政策效果评估的各种计量分析方法的影子。在药物效果或政策效果的评估分析中,匹配问题似乎成为因果性分析的核心问题,不少因果分析的统计学著作着重讨论处理组和控制组的匹配问题。对于匹配方法的研究,作为因果分析领军人物的伊本斯和鲁宾(Guido W. Imbens and Donald B.Rubin)的《统计学、社会科学与生物医学的因果推断导论》(Causal Inference for Statistics,Social,and Biomedical Sciences:An Introduction)非常值得阅读,该书详细地说明了各种匹配方法如何满足随机化要求的问题,有助于更好地深入理解因果分析结论的适用性。在本书的翻译出版过程中,赵天阳翻译了第1章和第2章的初稿,陈柯和顾雪芹翻译了第3章的初稿,顾雪芹翻译了第4章和第5章的初稿,伏开宝翻译了第6章和附录的初稿。在翻译初稿的基础上,朱保华对照原文校译修改了译稿,对专业术语和文体进行了统一,调整了少量数学公式的表示形式。格致出版社的程倩编辑、李月编辑等为本书的翻译出版付出了辛勤的劳动,对此表示衷心感谢。限于译者的学识,译稿难免存在不足之处,还敬请读者批评指正。
匹配、断点回归、双重差分及其他
本书综述了在应用经济学和其他社会科学中最常用的匹配、断点回归和双重差分的三种方法(及其拓展内容),介绍了方法内在的计量经济学和统计学思路,说明了参数识别的涵义及参数估计的实施方法,展示了使用各种方法进行实证分析的具体事例。本书强调了使用数据进行三种估计方法的实践,有用的在线附录提供了相应的数据与Gauss程序。理论计量经济学、统计学、应用经济学、社会科学等学科的研究者、学生都能从不同视角阅读本书而有所收获。社会经济政策的计量经济学评估:理论与应用
本书用计量经济学模型展示了政策对经济学产生的影响,具体讲明了政策的平均处理效应,参与者平均处理效应和未参与者平均处理效应在OLS,probit/logit、匹配法、断点回归分析、回归调整等计量经济学模型中的运用。从而揭示在政策真正产生效用的部分。计量经济学在政策中的应用可以探讨多方面的问题,例如:教育程度高低是否会影响女性生育意愿,政府政策的制定能否真的解决现存问题的关键等。同时,本书加入讲政策变量列入统计学软件STATA的操作方法,让研究者在经济学政策在计量经济学中的应用增加了实操性。是学习计量经济学不可或缺的工具书。不确定世界中的公共政策:分析和决策
公共政策的倡导者经常宣称“有研究表明”一个特定的政策是可取的。但是,他们所使用的研究方法可靠吗?以及分析结果如何影响公共政策的形成?这些公共政策涉及面极广,从疫苗接种政策到最低工资政策再到FDA的药物审批政策。目前的政策是基于不可靠的分析做出的。由于没有考虑真实世界的不确定性,政策分析似乎是利用了精准的理论分析结果“误导”了决策制定者。
本书对这一现状进行了批评,并且提出了一项如何改进政策研究以及决策者如何使用政策研究的建议。书中没有高深的数学模型,作者希望用一种大家都可以看懂的方式阐述当前不确定世界中复杂的公共政策问题,书中选取的很多政策案例如最低工资、学前教育等都具有很强的启示性,对于我们理解现实世界中的公共政策问题有很大的帮助。
[美] 乔舒亚·安格里斯特 约恩-斯特芬·皮施克 著计量经济学的方法和实践不断发展,有些过于新奇的方法本来没必要如此复杂,而且还可能是有害的。虽然对计量经济学基本工具的解释日趋精奥深微,但应用计量经济学的核心内容却保持着大体稳定。这本指南性质的教材为经验研究者把握计量经济学的精义提供一个向导,在讨论回归、工具变量和双重差分法等核心内容的基础上,强调估计值的一般性质(比如回归总是可以近似条件均值函数等),以及对估计值赋予因果解释所需的假设(比如条件独立假设、相似世界等),之后再扩展至非连续实验的回归分析及统计推断等问题。尤其是,作者对OLS和IV,从方法论到各种应用,讲解极为详细,把所有目前流行的带试验色彩的估计方法,全部放在回归的框架中分析和讨论,但不涉及试验设计的内容。 [美] 乔舒亚·D.安格里斯特 约恩-斯特芬·皮施克 著应用计量经济学的狂热拥趸们认为,“计量经济学,就是最初的数据科学”。计量经济学包含了经济学家在探求人类活动的因果关系时使用的统计学方法。通过浅显易懂的讨论和一系列以电影《功夫熊猫》为线索的幽默故事,本书为计量经济学研究提供了五个最有用的工具,即“盖世五侠”——随机实验、回归、工具变量、回归断点设计以及双重差分。医疗保险让你变得更健康了吗?随机试验可以提供答案。昂贵的私立大学,或者具有高度选拔性的高中,真的比更为普通的机构更好吗?回归分析和回归断点设计揭示出让人惊讶的真相。当私人银行破产在即,储户挤兑时,中央银行应该介入并提供救助吗?对大萧条时期银行业危机进行的双重差分分析,能够对这个问题给出回答。逮捕辛普森能够挽救其前妻的生命吗?工具变量法能指导执法部门对家庭暴力做出最优应对。计量经济学(第三版)编写延续了前两版的思想,其中:修改后的第10章对面板数据回归中标准误的处理进行了更新,即群集标准误(clustered error)计算方法;第13章中对试验和准试验的处理。直接应用多元回归方法,使倍差回归方法的讨论更加简明;第12章对弱工具变量的讨论进行了更新;引入“可能结果”分析方法分析实验数据;同时还增加了不少专栏内容,更新了原有案例和专栏的数据和结论。