新“拟随机实验”方法的兴起——断点回归及其在经济学中的应用
来源 :经济学动态
作者:余静文、王春超,本文是国家社科基金项目( 10B JL 032) 、教育部人文社会科学研究项目 ( 09YJC 790122) 和广东省普通高校人文社会科学 研究项目( 10WYXM042) 的阶段性研究成果
一:断点回归理论及发展历史
断点回归是一种拟随机实验, 此种随机实验定义了这样一个特征, 即接受处置 (Treatment) 的概率是一个或者几个变量的间断函数。Hahn et al (2001) 提出了断点回归的首要假设, 如果变量d表示处置效应, x表示决定处置的关键变量, 那么
必须存在, 并且d+≠d-。在使用断点回归的情况下, 存在一个变量, 如果该变量大于一个临界值时, 个体接受处置, 而在该变量小于临界值时, 个体不接受处置。一般而言, 个体在接受处置的情况下, 无法观测到其没有接受处置的情况, 而在断点回归中, 小于临界值的个体可以作为一个很好的可控组 (Control Group) 来反映个体没有接受处置时的情况, 尤其是在变量连续的情况下, 临界值附近样本的差别可以很好地反映处置和经济变量之间的因果联系。断点回归可以分为两类:第一类, 临界值是确定的 (Sharp) , 即在临界值一侧的所有的观测点都接受了处置, 反之, 在临界值另一侧的所有观测点都没有接受处置。此时, 接受处置的概率从临界值一侧的0跳转到另一侧的1。第二类, 临界点是模糊的 (Fussy) , 即在临界值附近, 接受处置的概率是单调变化的。Hahn et al (2001) 在一定的假设下, 证明了无论是哪一类型的断点回归, 都可以利用临界值附近样本的系统性变化来研究处置和其他经济变量之间的因果关系。
断点回归是由美国西北大学的心理学家Campbell于1958年首先发展设计出来的, 从那时开始直到20世纪80年代, Campbell和西北大学心理学系和统计学系的同事一直从事断点回归的设计和研究工作。Thistlethwaite&Campbell (1960) 正式发表了第一篇关于断点回归的论文, 他们提出断点回归是在非实验的情况下处理处置效应 (Treatment Effects) 的一种有效的方法, 主要应用于心理学和教育学领域。随后, Campbell&Stanley (1963) 为断点回归提供了更加清晰化的概念, 但是他们并没有给出断点回归统计上的证明。
在他们看来, 断点回归主要是为了解决选择性偏误 (Selection Bias) 问题, 断点回归利用了一个取决于某连续变量的间断函数, 这个间断函数完全决定了个体是否受到处置, 这就使得样本选择的细节完全展示出来, 使得我们知道样本选择的问题所在。此外, Campbell&Stanley还认为断点回归仅仅是在间断的临界值处类似于随机实验, 其推论的有效性也仅仅局限于间断的临界值处。整个20世纪60年代, 断点回归方法的应用还停留在一种直觉的推导, 而缺乏统计上严密的证明。
Goldberger (1972a, b) 曾对断点回归的无偏因果推断进行了证明, 可惜的是, 他的论文并没有得到发表, 这主要是因为他认为断点回归的适用环境是一个高度理想化的环境, 其适用范围十分有限。相反, 变量之间因果关系的推断还包括了工具变量法 (IV Approach) 和Heckman处理样本选择问题的模型, 这两种方法的适用性更加广泛, 从而使得人们忽视了断点回归方法的应用, 也使得断点回归在很长一段时间内消失在人们的视野之中。随着Campbell等人所认为的断点回归适用性仅仅局限于临界值附近这一论断被证伪之后, 断点回归才开始重新回到人们的视野之中。Rubin (1977) 证明了在个体是否接受处置仅仅取决于一个关键变量的情况下, 处置效应能够在关键变量的整个范围内得到无偏的因果推断。Sacks&Ylvisaker (1978) 提出了断点回归的估计方法, 并在理论上给予了较粗略的证明。他们将被解释变量分解为观察变量的线性组合再加上一个非随机的误差项, 其估计方法类似于局部非参数回归 (Local Nonparametric Regression) , 其有效性不仅仅是对于临界值附近的样本, 而且可以扩展到关键变量的整个领域。
断点回归在理论方面取得了新进展的同时, 其他因果推断方法的不足之处也逐渐地被认识。比如, 工具变量法存在局限性, 特别是排他性 (Excludability) 条件难以满足, 即难以保证工具变量仅仅通过影响关键解释变量而影响到被解释变量, 寻找合适的工具变量存在一定的困难。此外, Lalonde (1985) 发现Heckman样本选择模型并不能产生和随机实验一样的结果。正因为因果关系的推断是经济学家所关注的最主要的问题, 并且现有的因果推断方法都不能得出完全合理的因果关系, 人们开始逐渐将目光转向了断点回归。
Trochim (1984) 继续了他老师Campbell的工作, 综合了之前关于断点回归的理论和方法, 并且将断点回归类型分为两类:第一类是确定型的断点回归 (Sharp Regression Discontinuity) , 即个体在临界值一边接受处置效应的概率为1, 而在临界值另一边接受处置效应的概率为0;第二类是模糊型的断点回归 (Fuzzy Regression Discontinuity) , 即个体接受处置效应的概率均大于0小于1, 个体在临界值一边接受处置的概率大于在临界值另一边接受处置的概率。Trochim特别对第二类断点回归问题进行了研究, 并开始利用该方法进行实证研究。与Campbell观点不同, Trochim认为断点回归的应用性并非那么狭隘, 相反, 其应用范围还十分的广泛。除此之外, 他还强调了决定处置的关键变量不仅仅可以是一个单一变量, 而且还可以是一个合成变量。随后, 断点回归的优势逐渐被学界所认可, 其应用也愈加广泛。具体而言, 其优势包括两方面:第一, 断点回归可以应用于对经济成本和伦理道德问题的考虑, 随机实验不能进行的环境;第二, 断点回归优越于所有其他已知的因果推断方法, 其结果十分接近于随机实验结果。Lee&Lemieux (2010) 也通过形象的例子展示了断点回归和随机实验的相似性。Hahn et al (2001) 最终为断点回归的模型识别和模型估计进行了严格意义上的理论证明, 并提出了相应的估计方法, 由此, 断点回归在经济学中的应用如雨后春笋般出现在重要经济学文献中。
二:断点回归的实施步骤
(一) 确定型断点回归
运用图形来分析处置效应是否存在是断点回归分析的基础。图形分析在断点回归的实施中扮演着重要的角色, 通过将样本点和决定处置的关键变量在坐标系中描述出来, 便可以清楚地看到临界值附近的样本点是否存在跳跃。如果样本点存在跳跃, 那么说明确实存在处置效应, 相反, 如果样本点没有出现相应的跳跃, 那么说明断点回归的模型识别可能存在问题。当我们从图形分析中发现了临界值处存在处置效应, 那么就应当做进一步更加细致的计量实证分析。为了使图形更为直观, 需要根据决定处置的关键变量来划分箱体 (Bin) 和箱体的范围h, 并在该范围内计算变量的均值。一般而言, 箱体的范围需要大到包含足够多的样本使其样本点在临界值两边都比较平滑, 但又要小到一定程度使得样本点在临界值处的跳跃能够明显地显现出来。Lee&Lemieux (2010) 提出两种方法来选择合适的箱体范围:第一种是根据对数据的观察决定使用K个箱体;然后对K个箱体的虚拟变量做回归;随后, 将箱体范围缩小二分之一, 使得箱体由K个变为2K个, 将2K个箱体的虚拟变量作为解释变量再做一次回归。由于使用K个箱体虚拟变量的回归是内嵌于使用2K个箱体虚拟变量的回归之中的, 因此, 可以使用标准的F检验来比较判断K个箱体和2K个箱体的优劣。
第二种方法是基于这样一个原理, 如果箱体足够的小, 那么被解释变量和决定处置的关键变量将不会出现系统的联系, 因此, 可以将被解释变量对箱体的虚拟变量以及该虚拟变量和决定处置的关键变量的乘积项做回归, 并使用F检验来判断虚拟变量和关键变量的乘积项是否显著的为0。通过以上方法得到合适箱体范围后, 便可以分别对临界值两边的样本进行估计, 得到临界值两边的平滑曲线, 具体实施步骤如下:
第二步, 同时利用临界值两边的样本进行回归。这就好比在非参数回归中使用了rectangular的核, 选取叶宽 (bandwidth) h, 将样本的估计局限在h范围内。一般而言, 可以使用非参数回归, 但是如Hahn et al (2001) 指出的, 非参数回归会产生高阶数的偏差, 简单的非参数估计往往并不具有吸引力, 所以对于样本的回归可以采取局部线性回归 (Local Linear Regression) , 即最小化下式:
这其中存在叶宽h选择的问题, Hahn et al (2001) 提出最优的叶宽与N-1/5成比例。例如, 样本增加32倍, 那么32-1/5为1/2, 叶宽就可以减少一半, 但是这并没有解决如何选择叶宽的问题。计量经济学和统计学的文献中有两种选择叶宽的方法:第一种方法是根据拇指规则 (Rule of Thumb) 对整个样本的数据进行估计以求得最优叶宽。比如, 对于rectangular的核, 最优叶宽可以根据下式求出:
其中σ2是断点回归的标准差, m″ (·) 表示断点回归方程的二阶导数, R是断点回归方程估计时Xi的范围, 2.702是使用rectangular核估计的常数。另一种方法是交叉验证法 (cross-validation) , 即首先对临界值两边的样本分别进行回归, 得到:
此外, 断点回归中也可以加入其他的控制变量, 这样做的原因是消除小样本偏差, 同时使得估计更为精确。具体而言:如果控制变量Z的以X为条件的分布在临界值处是连续的, 那么Z的加入对处置效应的估计几乎没有影响, 因为Z是独立于处置效应的;同时, 只要X接近临界值, 那么Z的加入并不会对估计的偏差产生任何影响, 但是, 实际应用中, 样本的选择往往并不能保证X足够接近于临界值, 因此, 在计量模型中加入控制变量可以消除由额外变量造成的偏差, 并且, 如果Z与被解释变量有关, 控制变量的加入还可以改进估计的精确性。
第三步, 对断点回归的结果进行稳健性检验。首先, 需要检验其他控制变量在临界值处是否存在跳跃, 如果其他的控制变量在临界值处存在显著的跳跃, 那么被解释变量在临界值处的跳跃将不仅仅是由于处置效应所带来的, 这使得断点回归不能进行有效的因果推断。其次, 需要检验决定处置的关键变量的条件密度是否存在不连续的情况, 如果条件密度发生了跳跃, 那么说明存在个体操作关键变量的可能。为此, 可以计算每个箱体中样本的数量, 将其作为纵轴, 将关键变量作为横轴, 通过图形和回归分析来考察关键变量的分布在临界值处是否存在跳跃。如果存在跳跃, 则个体可能存在操作处置的可能, 从而使断点回归方法失效。再次, 需要检验当临界值取其他值时, 变量是否存在跳跃。如果变量不仅在临界值处存在跳跃, 而且也在其他值处存在跳跃, 那么变量的跳跃是由处置效应造成的这一推断就值得怀疑, 可能还存在其他因素决定了变量在临界值处的跳跃。最后, 需要在计量模型估计时, 使用不同的叶宽, 并且分别考虑加控制变量和不加控制变量的情况, 以此来考察不同的计量模型形式是否对结论产生了显著的变化。
(二) 模糊型断点回归
第一步, 与确定型断点回归一样, 运用图形来分析变量是否存在跳跃以及个体在临界值处接受处置的概率是否存在跳跃。
第二步, 使用两阶段最小二乘 (TSLS) 的方法来估计处置效应。具体步骤如下:
由于, 模糊型断点回归中需要进行两次计量回归求出τy和τD, 因此最优叶宽的选择需要同时考虑这两次回归的结果, Lee (2008) 提出使用以下的准则来求出最优叶宽:
第三步, 对断点回归的结果进行稳健性检验。检验步骤与确定型断点回归一样。
三:断点回归在经济学中的应用
(一) 劳动和教育经济学领域
由于在劳动力市场和教育部门中, 政府外生制定的政策和法规种类较多, 所以断点回归在劳动和教育经济学领域中的应用十分常见。Angrist & Lavy (1999) 利用以色列教育制度对班级大小的规定, 即班级大小必须小于或等于40人, 如果超过40人, 必须将原来的班级分成两个班级, 通过断点回归来研究班级的大小对学生成绩和教育质量的影响, 他们发现班级学生人数越小, 其学生的考试成绩越好。
Black (1999) 利用家庭所属入学区不同这一特征, 将入学区之间临界线两侧的样本作为研究对象, 作者使用了享乐价格函数 (Hedonic Price Function) 估计了入学区之间存在的教育质量差异对房屋价格的影响, 并以此考察了为获得更优质的教育家庭的支付意愿, 其研究结果表明, 如果小孩测试分数提高5%, 家长愿意多支付2.5%。Hoxby (2000) 运用断点回归研究了班级大小对教育质量的影响, 他同样利用了Angrist&Lavy (1999) 所使用的政府对班级大小的规定, 并考虑到入学对年龄的要求会导致不同年级的人数会有差别, 而这差别又会对班级大小产生影响这一机制, 其实证结果并没有支持Angrist&Lavy (1999) 的结果。Lalive (2007, 2008) 使用断点回归研究了失业工人补贴时限的延长对劳动力市场的影响, 由于奥地利对50岁以上失业人员补贴的时限与50岁以下失业人员补贴时限不一致, 因此, 通过比较50岁上下失业人员的情况, 就可以发现这种失业补贴时限不一致对失业时间以及新找工作的待遇和类型的影响;同时, 由于这种政策的实施还存在地理位置上的差异, 因此, 通过比较地区间临界线两侧的样本同样可以发现失业补贴时限对失业的影响, 作者证实了补贴时限越长, 工人失业的时间就越长。Chiang (2009) 利用了美国弗罗里达州实施的对教学质量没有达标的学校进行惩罚这一规定, 使用断点回归的方法研究了这种激励措施对教学质量的直接影响, 他发现受益于这种激励, 学校的教学质量, 特别是学生的数学成绩有了一定幅度的改进, 同时, 学校也加大了教学基础设施建设、实验工具和老师培训方面的支出。Clark (2009) 利用了英国中学必须获得学生家长一定份额的票数才能进行自治这一规定, 运用断点回归研究了通过投票方式获得自治的学校和没有获得自治的学校在教学质量上的差别, 他发现得到自治权的学校在考试通过率上表现更好。雷晓燕等 (2010) 利用了中国政府对退休年龄的规定, 运用断点回归的方法分析了退休对健康的影响, 他们发现在正常退休年龄退休对男性健康有显著的负面影响, 相反, 这种负面影响并没有在女性群体表现出来。
(二) 政治经济学领域
在政治经济学研究领域中, 由于政党选举通常需要得到一定的选票, 而获得多少选票可以当选是由法律规章制度预先设定的, 因此, 存在一个当选与不当选的选票临界值。断点回归便是利用了这一临界值附近的样本来考察选民对政策的影响、在职者的政治优势和政府的开支等等一系列问题。
在美国众议院选举中, 一个政党如果能够获得所属选区50%以上的选票, 那么就能够赢得该选区的选举。Lee et al (2004) 利用了50%得票率是获选与否的关键决定因素这一特征考察了选民对竞选者政策选择的影响。现有理论中存在两种关于选举对政策影响的观点:第一种观点认为, 竞选者倾向于采取符合处于中位数选民偏好的政策, 即所谓的唐斯收敛效应 (Downsian Convergence Effect) ;第二种观点认为, 考虑到政治家的承诺在选举后并不能完全兑现, 选民倾向于选择当前最有利于他们权益的政策。Lee et al通过考察竞选者面临相近的选票时, 即选举的压力加大时, 是否会改变自己所提倡的政策, 其实证结果表明唐斯收敛效应并不存在。相反, 选民会在两党竞选者中选择出制定了对自己最有利政策的竞选者。
在同样的背景下, Lee (2008) 也利用了必须获得50%以上选票当选这一个规则, 使用了断点回归方法研究了美国众议院当选者是否会利用本次当选所得到的权利, 从而有利于在下一届众议院选举中再次当选这个问题, 他发现众议院的当选者赢得下一次选举的概率更大。Albouy (2009) 以美国两党制为背景, 研究了国会 (包括参议院和众议院) 议员的党派身份对联邦政府在国会议员所属区域支出的影响, 由于一个党派在参议院和众议院获得超过50%选票便能够成为该院占多数的党派, 进而能够对议案的通过产生影响, 因此, 50%的选票便是一个临界值, 通过比较临界值附近的样本差异, 便可以得到获得国会多数席位的国会议员党派对联邦政府支出的影响, 他的研究结果表明, 在国会获得多数席位的议员党派往往能够为该党派议员所属州争取更多的政府支出, 并且对于不同的党派, 政府支出的表现形式还存在差异, 当共和党获得国会多数席位时, 其议员所属州将会得到更多的国防开支, 而当民主党获得国会多数席位时, 其议员所属州将会得到更多教育和城市发展方面的政府开支。
Ferreira&Gyourko (2009) 同样使用断点回归的方法分析了政党选举对政治经济的影响。与之前研究不同的是, 他们使用的是美国城市的数据, 考察的对象是市长的选举, 其研究结果表明, 当选者仍然能够以较大概率赢得下一任的选举, 但是国会选举所表现出来的党派政治对政策和经济的显著影响这一结论并不适用于市长选举。党派政治对市政府的规模、公共品的支出和犯罪率并没有明显的影响, 他们认为这其中的原因在于城市之间较强的同质性和城市之间的竞争使得党派政治对政策和经济的影响有所削弱, 同时也使得竞选者的承诺更为可信。
(三) 环境经济学领域
在环境污染方面, 许多国家都颁布了相关的政策和法令来控制日益严重的环境问题, 这也提供了可以利用断点回归进行政策分析和研究的背景。Chay&Greenstone (2005) 使用了断点回归的方法研究了人们对避免空气污染的支付意愿, 美国政府于20世纪70年代颁布了清洁空气法案 (Clean Air Acts) , 即一个地区如果污染程度超过联邦政府所制定的临界值, 那么环保局会将该地区视为未达标地区, 从而使得该地区面临更为严格的监管。因此, 联邦政府为地区污染所制定的排放临界值便成为实证研究中的一个间断点, 通过比较超过排放临界值地区和未超过排放临界值地区的房价水平, 他们发现, 受到环保局更严格监管地区的悬浮颗粒总量会有所下降, 并且悬浮颗粒总量每下降1, 地区的房价便会提高0.4-0.5%。Davis (2008) 利用了墨西哥城于1989年实行的名为Hoy No Circula的项目, 即每周车辆将根据其牌照最后一位数字而被限行一天, 运用断点回归的方法研究了这一车辆限行政策对空气质量的影响, 他发现车辆限行政策并没有改善当地的空气质量, 相反, 车辆限行提高了未被限行车辆的使用率, 同时人们也转而使用高排放量的车辆。Greenstone&Gallagher (2008) 使用断点回归的方法研究了1980年美国国会通过的并由卡特总统签署的综合环境反应、赔偿和责任法案 (Comprehensive Environmental Response, Compensation, and Liability Act, CERCLA) 所产生的经济价值, CER-CLA要求环保局对污染物质排放超标或对公共健康和环境构成威胁的地区实行环境清洁计划的权利, 因此, 污染物质排放水平便成为关键变量, 它决定着一个地区是否实行了环境清洁计划。通过比较实行环境清洁计划地区和未实行环境清洁计划地区的房价和房屋租金, 他们发现如果一个地区实行了环境清洁计划, 那么20年后, 该地区的房屋财产价值将会增加4200万美元, 并且居住人口也会显著增加。Almond et al (2009) 研究了中国使用暖气的政策对地方环境污染的影响, 在1950-1980年间, 由于财政不足以令全国地方政府提供免费煤炭以暖气供暖, 但当时只有淮河和秦岭以北的地区能够得到免费的煤炭供暖, 这项政策的实施使得以淮河和秦岭为界的南北地区空气污染程度产生了显著的差别, 他们使用断点回归的方法对这一问题进行了细致的研究, 其研究结果表明淮河和秦岭以北的地区空气中悬浮颗粒总量明显高于淮河和秦岭以南的地区, 并且北方悬浮颗粒总量的指标是美国的5-8倍。
(四) 发展经济学领域
断点回归在发展经济学领域中的应用主要利用了各个地区行政区域划分的特点。Dell (2008) 利用断点回归的方法研究了历史制度对区域经济影响的持久性, 并考察了历史制度影响当前经济绩效的渠道。玻利维亚和秘鲁的执政者在16世纪西班牙殖民地时期, 均在波托西 (Potosi) 银矿和万卡维利卡 (Huancavelica) 水银矿地区实行了名为Mita的征收劳工制度, 即执政者要求征用各个地区男性人口的七分之一用于开采银矿和水银矿, 如果一个地区与矿产的距离较远, 那么来回运输和监督成本就会很高, 因此, 出于对经济利益的考虑, 一个地区是否实行了Mita制度在很大程度上取决于该地区与矿产距离的远近, 通过比较Mita制度实行区域与未实行区域之间临界线两侧的样本, Dell发现Mita制度的实施减少了当前地区消费的32%, 并且Mita制度主要通过影响产权界定和公共物品的提供两个渠道影响了当前的地区经济绩效。余静文和赵大利 (2010) 、余静文和王春超 (2010) 也利用了城市圈形成依赖于中心城市的辐射涓滴作用这一特性。如果一个地区距离中心城市较远, 那么通过产业对接、产业互补和资源的重新配置发挥中心城市带动周边地区经济发展的辐射效应就会有所减弱, 因此城市圈的划分与一个地区距离中心城市的远近相关, 通过比较城市圈临界线两侧的样本, 可以得到城市圈形成对地区经济绩效的影响。余静文和赵大利以京津冀、长三角和珠三角城市圈为例, 使用了断点回归方法和分位数回归方法研究了城市圈区域经济的收入差距问题, 他们发现, 城市圈的形成所产生的集聚效应、辐射效应和政府治理改变的综合影响在不同阶段表现出不同的形式, 城市圈地区收入差距也没有呈现出一致的趋势;余静文和王春超利用武汉城市圈和长株潭城市圈的数据, 使用断点回归的方法考察了城市圈形成对城市圈区域经济绩效的影响, 他们发现城市圈形成产生的辐射效应和政府治理结构转变所带来的效应之和大于中心城市产生的“以大吞小”效应, 从而促进了城市圈区域的经济发展。
四:简 评
长期以来, 断点回归作为最接近于随机实验的方法被经济学家所忽视, 直到20世纪90年代, 该方法才开始被应用到经济学分析之中。本文从断点回归的理论、发展历史、实证步骤和其在经济学中的应用几个方面介绍了断点回归这一新“拟随机实验”的兴起和最新发展。对于中国这样一个既处于转型又处于高速发展阶段的大国, 政策和规则的改变往往提供了一个实施断点回归的绝佳背景, 但是使用断点回归来研究和分析中国政策因素所产生影响的文献还十分缺乏, 本文的目的在于向国内经济学界介绍这一新的实证方法, 普及其在中国经济问题研究中的应用。
虽然断点回归在政策评估和因果推断方面有着很大的优势, 但是在运用过程中需要注意以下几点:
第一, 如果个体能够精确地操作决定处置的关键变量, 那么断点回归方法便是无效的;
第二, 即使个体能够对决定处置效应的关键变量产生影响, 但只要这种影响不足以使得个体能够精确地操控它, 那么在临界值处的处置效应依然会如同随机试验一般, 呈现出随机的形式, 此时, 便可利用模糊型断点回归方法进行研究;
第三, 断点回归方法可以像随机实验一样来分析和检测, 比如, 在处置实施之前, 可以检验被解释变量是否呈现出系统性的变化;
第四, 在实施断点回归的实证研究中, 参数估计依然具有很好的性质, 与其将此非参数估计看成是参数估计的替代, 还不如将其看成是参数估计的一个补充。