合成控制法SCM与DID、PSM区别
来源:《经济研究》2015年第6期,苏治、胡 迪:通货膨胀目标制是否有效 ?
详细内容请阅读原文。
本文研究目的是要更为客观地评价通货膨胀目标制在新兴市场国家的实施效果,通过对比实施国与合成控制国在IT政策实施前后的情况,从通货膨胀率是否有显著变化的角度衡量目标制的有效性。与早期实证研究这一问题所采用的双重差分法(DID)和倾向匹配得分法(PSM)相比,合成控制法更适用于分析IT政策对控制通货膨胀率的作用。
应用双重差分法研究IT政策有效性(Batini&Laxton,2006;Goncalves&Sails,2008)在时间维度上将所有国家的经济情况在一个特定的实施点前后分开,对比目标国家和未实施IT政策的国家的通货膨胀率差距。这存在一系列的问题:(1)无法准确地确定政策实施前后的时间段,因为不同的国家开始实施IT政策的时间是不一样的,实施IT前的时间段长短也不尽相同;(2)与之相关的另一个问题是,如何定义非目标国家的政策后时期。Batini&Laxton(2006),Goncalves&Sails(2008)采用平均目标国政策后的时间来定义政策后时期,对个体国家而言,这显然是不合理的。(3)更为重要的是,双重差分法对参照组的选择具有主观性和随意性。目标国家与对照国家之间的系统性差异可能是目标国家选择IT政策的原因,这就不可避免地会遇到政策内生性问题。应用倾向得分匹配法研究IT政策(Lin&Ye,2009)是基于条件独立的假设(conditional independence assumption,CIA)建立对照组拟合随机试验来分析IT政策对实施国的影响。倾向得分匹配法与合
成控制法有一定的相似之处,因为二者都是利用非目标国家(对照国家组)的信息建立了人工对照组。但倾向得分匹配法的问题在于:一方面该方法选择国家一年份数据作为个体形成混合数据,不能有效分析个体国家的通货膨胀情况。例如,巴西一1999年与巴西一2000年是作为不同的观测对象,与智利一2000年这个个体无异;另一问题则是在选择匹配变量以估计倾向得分的过程中,无论是用当期的系列协方差还是与滞后一期的国家一年份数据相关的协方差,结果都会因为国家一年份的交错而导致偏差。
而合成控制法能够很好地克服上述两种政策评价方法所涉及的问题,通过数据驱动的方式对多个控制组对象进行加权,构造一个与目标组完全类似的控制对象。其优势体现在:(1)作为一种非参数的方法,扩展了传统的双重差分法。(2)通过数据驱动确定权重,减少了主观选择的误差,避免了政策内生性问题。(3)通过对多个控制对象加权来模拟目标对象政策实施前的情况,不仅可以清晰地反映每个控制对象对“反事实”①事件的贡献,同时也避免了过分外推。可以对每一个研究个体提供与之对应的合成控制对象,避免平均化的评价,不至于因各国政策实施时间不同而影响政策评估结果,避免了主观选择造成的偏差。(5)研究者们可在不知道实施效果的情况下设计实验。目前合成控制法在其他政策评价领域得到了广泛的应用(Abadie et al.,2010;Campos & Kinoshita,2010;王贤彬和聂海峰,2010;刘甲炎和范子英,2013)。
但是我们也注意到合成控制法在应用上的局限性。在对多个控制组对象进行加权构造一个与目标组完全类似的控制对象时,权重的选择要求为正数,且和为1。当目标国家的特征向量远离其他国家特征向量组的凸组合时,则找不到合适的权重来模拟目标国家。例如,20世纪80年代至90年代初期,巴西、墨西哥等国家经历了较长的恶性通货膨胀,控制组国家无法通过加权得到与巴西或墨西哥一样的通货膨胀率,合成控制法在这种情况下就不再适用。在合成控制法未来的发展中,一方面可以对权重的限制加以放宽,允许负权重的出现以适应更大范围的应用空间;另一方面,可改进用于估计假设政策没有实施情况下的因子模型(式(1)),扩展为其他线性或非线性形式。