合成控制法:西班牙巴斯克地区恐怖活动的经济成本
1、合成控制法
为了探究和评估某项政策的影响和有效性,学者们经常用案例比较研究的方法,将受到政策或者干预影响的个体的结果和没有受到干预的控制组的个体的结果来比较。但是案例比较研究会受限制于两个问题,从而影响估测的结果。一方面,比较个体的选择有主观性,研究者经常是基于主观衡量受政策影响和不受政策影响个体之间的密切关系来选择比较个体。另一方面,当总体数据不可得时,通常会用样本数据去推断,但是会存在误差。并且即使可以得到总体数据,也不一定可以用控制组的总体数据来估计干预组的反事实结果。
因此,用数据驱动的生成机制来构造合适的控制组,主要基于可观测可计量的特征来证明受政策影响和不受政策影响个体之间的密切关系,减少了对控制组的主观选择。同时,在实际中,可能不存在和干预组个体在政策影响前相似的控制组个体。
Abadie andGardeazabal (2003)提出“合成控制法”(Synthetic Control Method)。合成控制法的基本思路是 :通过对现有备选的多个控制单元进行权重加总,合成的一个对照组与实验组的特征就极为相似 , 因而能较好地作为实验组的对照面来进一步展开反事实分析 。
2、西班牙恐怖活动
政治不稳定被认为对经济繁荣有强烈的负面影响。然而,到目前为止,关于这个问题的证据还很少,这可能是因为人们很难了解在没有政治冲突的情况下,经济会如何发展。
本文以巴斯克地区的恐怖主义冲突为例,探讨了犯罪对经济的影响。从经济角度来看,巴斯克冲突特别有趣。在20世纪70年代早期恐怖活动开始时,巴斯克地区是西班牙最富裕的地区之一,人均GDP在17个地区中排名第三。上世纪90年代末,在经历了30年的恐怖主义和政治阴谋后,这个巴斯克国家的人均国内生产总值下降到了第六位。
在此期间,巴斯克恐怖组织埃塔的恐怖活动造成近800人死亡。巴斯克的企业家和公司是暴力和勒索的具体目标(包括暗杀、抢劫和绑架勒索)。毫不奇怪,在那些年里,巴斯克经济遭受的经济衰退至少部分地归因于恐怖主义的影响。然而,很少有研究进行了评估的经济影响的欺诈。
这种类型的研究是不同的。一方面,对恐怖主义的严重程度和巴斯克经济的发展进行纯粹的时间序列分析,会受到西班牙在20世纪70年代下半叶和80年代上半叶恐怖主义活动高峰期所遭受的经济衰退的污染。另一方面,在恐怖主义开始的时候,巴斯克地区与西班牙其他地区的特点不同,这些特点被认为与经济增长潜力有关。因此,简单地比较巴斯克经济和西班牙其他地区的经济发展,不仅能反映恐怖主义的影响,而且还能反映恐怖主义前经济增长决定因素差异的影响。
我们的分析基于两种不同的策略。首先,我们使用西班牙其他地区的组合来构建一个“综合”控制区,该控制区与上世纪60年代末巴斯克政治恐怖主义开始之前巴斯克国家的相关经济特征相似。这个“反事实”的没有恐怖主义的巴斯克国家的后续经济发展与巴斯克国家的实际经验相比较。我们发现,在恐怖主义爆发后,巴斯克地区的人均GDP相对于综合控制区下降了约10个百分点。
关于更多内容,请阅读原文
Abadie, A. and Gardeazabal, J. (2003) Economic Costs of Conflict: A Case Study of the Basque Country American Economic Review 93 (1) 113–132.
该数据集包含1955-1997年西班牙17个地区的信息。Abadie和Gardeazabal(2003)用它研究了冲突的经济效应,将巴斯克地区的恐怖主义冲突作为案例研究。本文结合西班牙其他地区,构建了一个类似于20世纪70年代政治恐怖主义爆发前巴斯克地区许多相关经济特征的综合控制区。数据包含了相关年份的人均GDP(结果变量),以及人口密度、部门生产、投资和人力资本(预测变量),并在这里用synth库演示了综合控制方法的实施。
3、数据介绍:
一个面板数据,由18个单元组成:1处理(17号)和16个控制地区(2-16,以及第18列)。一个变量是西班牙全国的平均值。结果变量(gdpcap),13个预测变量(6个部门生产份额、6个最高教育程度类别、人口密度和投资率)。
区域名称和数字存储在regionno和regionname中。42个年份跨度(1955 - 1997)。
详细变量为:
regionno
: Region Number.
regionname
: Region Name.
year
: Year.
gdpcap
: real GDP per capita (in 1986 USD, thousands).
sec.agriculture
: production in agriculture, forestry, and fishing sector as a percentage of total production.
sec.energy
: production in energy and water sector as a percentage of total production.
sec.industry
: production in industrial sector as a percentage of total production.
sec.construction
: production in construction and engineering sector as a percentage of total production.
sec.energy
: production in marketable services sector as a percentage of total production.
sec.energy
: production in Nonmarketable services sector as a percentage of total production.
school.illit
: number of illiterate persons.
school.prim
: number of persons with primary education or without studies.
school.med
: number of persons with some high school education.
school.high
: number of persons with high school degree.
school.post.high
: number of persons with tertiary education.
popdens
: population density (persons per square kilometer).
invest
: gross total investment as a share of GDP.
4、合成控制法及R应用
原文出来结果图:
Sources: Authors’ computations from Matilde Mas et al. (1998) and Fundacio´ n BBV (1999).
a 1986 USD, average for 1960–1969.
b Gross Total Investment/GDP, average for 1964 –1969.
c Persons per square kilometer, 1969.
d Percentages over total production, 1961–1969.
e Percentages over working-age population, 1964 –1969.
合成控制法图
代码为:
1、导入数据
# 1. combine highest and second highest
# schooling category and eliminate highest category
# 2. make total and compute shares for the schooling catgeories
# run synth
synth.out <- synth(data.prep.obj = dataprep.out)
# Get result tables
# results tables:
# plot results:
# path
## gaps
参考资料:
Abadie, A. and Gardeazabal, J. (2003) Economic Costs of Conflict: A Case Study of the Basque Country American Economic Review 93 (1) 113–132.
Abadie, A., Diamond, A., Hainmueller, J. (2011). Synth: An R Package for Synthetic Control Methods in Comparative Case Studies. Journal of Statistical Software 42 (13) 1–17.