查看原文
其他

统计计量 | 发现身边的“美”——那些别处心裁的工具变量

数据Seminar 2022-12-31


来源:知乎网友回答整理,版权归作者所有!此外,青椒Diego博士还添加了相关学习文献。

本文转载自公众号经管定量笔记

制度的工具变量——殖民时代的死亡率

比如Acemoglu(2001)找到的殖民时代的死亡率,我们可以把这篇论文放到更大的学术脉络中来看。一直以来,经济学家都想找到地区间经济绩效长期差异的决定性因素。一些经济学家认为可能是制度(North, 1981; Acemoglu, Johnson and Robinson, 2001,2004),另一些则认为地理因素更为基本(Diamond, 1997; Sachs and Warner, 1995, 1997)。关键是,在实证研究中我们很难测度制度、地理对经济增长的边际贡献。我们可以说,好的制度可以促进经济增长,也可以说,经济增长为制度构建提供了良好环境。

为了解决这一“内生性”问题,学者们就需要为制度找到合适的“工具变量”,这一变量要同时满足:对“制度”而言具有相关性,对“经济增长”而言又具有外生性。然后,我们就看到一系列很有意思的工具变量陆续亮相了。

厦门大学王亚南经济研究院的方颖、赵扬(2011)梳理了经济学家们既往不断寻找制度“工具变量”的过程。在西方历史中,不同的语言代表了不同的族源,从而有可能反映了不同制度的起源。Mauro(1995)利用这一差异作为各国腐败程度和政府效率的工具变量。【引注:Ryan提到的Tabellini, Guido(2008)的成果可以视为是这一进路的延伸】。

Hall and Jones(1999)则把各个国家到赤道的距离作为制度的工具变量。他们认为到赤道的距离大致反映了各国受西方影响的深浅,从而可以反映不同制度的变化。但是,不少经济学家(Bloom and Sachs, 1998; Gallup, et al., 1998)认为各国到赤道的距离还同时通过气候和地理等因素影响到经济增长,从而不符合工具变量外生性的要求。

Acemoglu, et al. (2001)建议把欧洲早期殖民者在各殖民地的死亡率作为制度的工具变量。如果早期殖民者在某地的死亡率较低,他们就倾向于向该地区移民,从而建立起仿效母国的制度。反之,如果死亡率较高,他们则倾向于在该地区建立掠夺性的殖民政府,尽可能将该地区的资源转移到母国。即使这些殖民地陆续获得了独立的权利,但由于制度的持续性,独立后的政府在很大程度上会延续原先坏的制度。但是,Glaeser, et al, (2004)认为早期殖民者死亡率的分布和当代流行疾病的分布相关,从而无法区分究竟是制度还是地理性的流行病分布决定了经济增长。另一方面,早期殖民者的死亡率也反映了各地区移入的人力资本,而后者也可能决定经济发展的不同路径。

而方颖、赵扬《寻找制度的工具变量:估计制度效应对中国经济增长的贡献》这篇论文主要贡献在于建立了中国地级市制度质量的工具变量,即以1919年各城市每千人中基督教教会初级小学注册学生人数作为制度的工具变量,并详细论证该工具变量的适用性。我们的研究发现,制度对于中国经济增长的边际贡献显著为正。如果制度的质量提高0.01,那么就可以提高该地区4.23%的Log人均GDP。在控制初始经济发展水平、历史人力资本、各类地理变量和政策变量后,制度对于经济增长的边际贡献仍然显著为正,而且其估计值表现出一定的稳定性。(知乎网友:@李金源,世事波上舟)

高速公路影响经济发展的工具变量——最小生成树

中国政府于1992年开始实施一项规模宏大的“高速公路网”计划,对此,学术界就修建高速公路是否有助于边缘城市的发展并缩小区域间的经济不平等展开讨论。由于“修路”的决策具有“内生性”——被纳入高速公路网的边缘城市,与那些没有被纳入高速公路网的城市之间,可能原本就存在着各种各样的内在差异,“通过高速公路与中心城市连接”和“边缘城市经济发展”之间存在相关性关系,并不能推出修路促进了经济增长,有可能是中心城市本身就比边远城市有在政治地位、资源禀赋等差异造成的。所以,问题的关键在于找到一个合适的“工具变量”:这个变量只通过影响“边缘城市被纳入高速公路网”的概率来影响“边缘城市的经济发展”,而与其它不可观测的影响经济增长的因素全部无关。

加州大学伯克利分校的经济学家Benjamin Faber独具匠心地利用算法中的“最小生成树”这一概念来构建工具变量,并由此估计修建高速公路的经济影响。他的主要思路是:给定一些确定的点(50万人口以上大城市,亦即“中心城市”)必须被纳入这个高速公路网,不考虑其它因素,理论上可以计算出一个对应的“最小生成树”(可以理解为一种铺设方案),使得铺设高速公路的总成本最低。作为一个理性的决策者,在其它条件不变的情况下,肯定倾向于用这种成本低的方案。因此我们有理由相信,在其它条件不变的情况下,如果一个边缘城市的地理位置恰巧处于上述的“最小生成树”上,那么它最终被纳入实际的高速公路网的概率就比其它的边缘城市更高,而这种概率的差异又完全是由算法的结果客观地决定,不受其它人为因素的影响。

于是,作者以“边缘城市是否处于最小生成树上”作为工具变量,在因果推断的层面上估计出了高速公路对区域经济发展的影响。

具体的实证结果方面,作者发现“被纳入高速公路网”对于“边缘城市的经济发展”具有显著而稳健的负面作用:在1997-2006年间,其它条件不变的情况下,被纳入高速公路网的那些边缘城市,相比于其它边缘城市,其经济增长率平均要低18个百分点,而其工业总产值的增长率平均要低26个百分点。

通过对几个推论的验证与分析,作者进一步确认,高速公路之所以会对边缘城市产生如此巨大的负面经济影响,主要原因是高速公路导致地区间运输成本下降,从而导致边缘城市的工业经济不断向中心城市聚集。

【参考文献】 Faber, Benjamin. Trade Integration, Market Size, And Industrialization: Evidence From China’s National Trunk Highway System. Working Paper, 2012. (知乎网友:@冯路,财经院校在校学生)

科举废除对社会流动性和革命的影响——河流数量

Bai Ying and Jia Ruixue(2014,working paper)研究晚清废除科举对社会流动性和革命的影响,其基本逻辑是科举废除使得原本依赖于科举作为上升通道的知识分子不得不以参加革命的方式来完成社会阶层的流动,而这一效应在原本就教育发达,科举盛行的地方体现得更为显著。为此,文章统计了有记载的同盟会等革命团体的成员的地域分布来说明这一点。文章主要是用科举名额来体现科举废除前各地通过科举实现社会流动的依赖性,而这个名额是以地域和对应人口来进行划分的。而且是非线性的不规则的划分。文章使用双差分法(DID),为了避免省略变量的影响,必须找一个在科举废除前后都不变化而且跟科举名额有关的变量来做工具变量。两位作者的一个巧思是使用该地域内的小河流的数目,逻辑是县城一般是依河而建,小河流数基本上体现了县的数量,而科举名额与县的数量相关,且小河流的数量在科举废除前后并不变化。这个工具变量的使用十分的巧妙。

其实现代经济史研究中工具变量的使用都非常的有意思,主要原因是历史研究的数据量和数据种类有极大的限制,不得不在可用的数据中寻找各种各样的工具变量,这其中又以Acemoglu大神最富名气和争议性。这里试举一例几个月前看过的文章,纯记忆必有疏漏,看看就好,有兴趣的请看原文。

参考文献:Ying Bai and Ruixue Jia(2014), "Social Mobility and Revolution: The Impact of the Abolution of China's Civil Service Exam", Working Paper (知乎网友:@Sean Ricky,学生)

制度与文化关系的工具变量——语法规则

tabellini(2008)的文章中用语言作为检验制度和文化关系的工具变量。

他认为,要寻找一个既会随着观念的变化不断进化,又不会与当前制度发生直接作用的机制只有一个——语言。支持他论点的逻辑如下——语言创新成本极大(大家一起换语言的成本很大),但是语言又并非一成不变,它会随着文化的改变而缓慢地演进。

于是tabellini运用了若干语法规则计量文化的变化怎样影响制度。具体而言,他运用了语言的两条具体规则:

(1)引用kashima(1998)的研究作为逻辑,即使用第一人称代词的文化更加重视个人和他的权利,于是tabellini定义了 no pronoun drop 作为变量。

(2)在有些文化中,人们用称谓首字母T-V的变化区别人与人之间的不同关系,这实质上体现的更加重视等级差异的文化,于是tabellini使用了2nd person differentiation作为变量。运用这样的方法,tabellini得出了文化(在他的意义而言是信任与尊重)影响制度的结论。

参考文献:Tabellini, Guido. "Presidential address institutions and culture." Journal of the European Economic Association 6.2‐3 (2008): 255-294. (知乎网友:@ Ryan,学习经济学)


除此之外,为大家推荐几篇有趣的工具变量相关文章





星标⭐我们不迷路!
想要文章及时到,文末“在看”少不了!

点击搜索你感兴趣的内容吧


往期推荐


统计计量 | “控制变量”不显著,是不是要剔除?

软件应用 | 如何用Stata绘制带指向性箭头标注的图像

统计计量 | 经典计量经济学教材推荐(含链接)

数据资源 | 人文社科开放数据库汇总(含文献链接)

数据可视化 | 造假防忽悠指南

数据治理 | 多人协同处理数据担心不安全?学会这一招,轻松管理你的数据团队

数据资源 | 收藏!数据资源下载网址大全






数据Seminar




这里是大数据、分析技术与学术研究的三叉路口


推荐 | 青酱


    欢迎扫描👇二维码添加关注    

点击下方“阅读全文”了解更多

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存