查看原文
其他

【量化历史研究】光影交错里的城市流变──一场时间与空间的旅程

2017-08-18 朱悦 量化历史研究

本文为“量化历史研究”第 172 篇推送

上世纪60年代和2010年 日本东京

(图片来源于网络)


建筑可以是凝固的音乐,而城市也可以是凝固的历史。究竟是哪些因素,影响了人类经济活动的集聚?Henderson、Squires、Storeygard和Weil即将在Quarterly Journal of Economics刊出的研究,利用全球灯光数据发现:考虑现代化较早和现代化较晚的这两类国家,在决定经济活动的空间分布时,农业地理条件对前一类国家比较重要,贸易地理条件对后一类国家比较重要。

研究的“亮”点之一是灯光。经济学研究需要了解当地的经济状况,但GDP数据可能存在以下几个问题:一是干脆没有,比如部分遭遇战乱的国家;二是质量低下,可能是调查机构能力不足,也可能是故意造假;三是利用不方便。GDP一般按行政区划来统计,但经济学家想要研究的区域并不一定与行政区划相重合。如果碰到这些情况,利用灯光数据是比较方便的。

灯光数据是基于什么原理呢?具体来说,天上有各种各样的卫星绕地球运行,定期采集一个地方夜间的灯光亮度。而灯光亮度又反映了当地人经济活动的频率和强度。从已有的一些研究看,灯光与人均GDP之间的相关程度非常好,一般高达0.8-0.9。因此,如果没有GDP,可以用夜间灯光亮度作为当地经济状况的代理变量;即使有,灯光数据也可以帮助改善GDP数据的质量。

在这篇研究中,作者按经纬度将全世界划分成250000个格子,然后按像素计算2010年时,每个格子的平均亮度,作为当地经济状况的代理变量。文章对灯光数据做了许多预处理,比如说处理烟雾、火山等可能干扰亮度的情形。此外,作者也考虑了格子中存在海洋、河流、湖泊等不能居住的区域这类特殊情况。结果如图1:很明显,发达国家更亮,城市区域也更亮。

图1  2010年,世界灯光亮度的分布


文章建立了一个简单的模型。其中,内陆和海岸两个区域要在农业和制造业之间配置劳动力,同时决定是否贸易。结果显示:对应不同的农业生产率和贸易成本,模型存在许多均衡。如果农业生产率和贸易成本都比较高,制造业受限于食物的约束,人口偏向于集聚在周边农业生产率高、农业地理条件较好的区域;当农业生产率较高、贸易成本较低时,制造业集中在贸易地理条件较好的海岸,以贸易解决食物问题。现代化较早的国家,农业生产率提高发生在贸易成本改善前,城市分布更可能倾向前者;较晚现代化的国家,农业生产率提高和贸易成本改善时间相隔不远,城市分布倾向后一种情况。

图2 1500-2000年,英国(现代化较早的国家)识字率的变化,以蓝点表示;印度(现代化较晚的国家)识字率的变化,以红点表示;世界范围内运费海运费用指数的下降,以绿点表示

为检验这一点,作者考察了全球各格子对应的农业地理条件和贸易地理条件。其中,农业地理条件包括海拔高度、均温、降水量、生长季节长度、纬度、农业适种程度、土地平整度、疟疾易感程度、植被类型,等等;贸易地理条件包括格子中心到最近可通航河流的距离、到海岸线的距离、到最低的5000平方千米以上湖泊距离,以及到最近自然港的距离,等等。

简单的统计分析发现:这些因素确实对格子里的灯光亮度有显著的影响,且方向大多符合预期。比如说,几个反映贸易地理条件的距离都和灯光亮度显著正相关,农业适种条件也和灯光亮度显著正相关,等等;也有一些符合不符合预期,比方说,有热带草原的地方,灯光亮度反而更低。回归式的拟合效果不错,接近0.4。此外,加入对应国家的二元变量不会明显改变结果。

图3  世界灯光亮度的分布:拟合值


那么,怎么检验前面模型中提到的结论呢?作者的选择是把不同国家分成两类:现代化较早的,以及现代化较晚的,然后看农业和贸易地理条件对两类国家灯光亮度的不同影响。现代化较早较晚的划分,作者选择的标准是教育。具体来说,就是看1950年时一国平均的教育年限,如果在阈值以上,那这个国家就是较早实现现代化;如果在阈值以下,这个国家实现现代化就比较晚。

 怎么挑选这个阈值?作者的方法是“让数据自己说话”,从中挑一个解释能力最好的值。首先,基于每个教育年限都把国家分成两类,将两类国家的灯光亮度分别对农业地理条件和贸易地理条件进行回归,看解释力分别有多少。然后,挑那个能最大化解释能力之和的教育年限作为阈值。按照这个方法,挑出来的值是3.6:1950年时,平均教育年限超过3.6年的是较早现代化的国家;反之,则是现代化较晚的国家。

图4  基于1950年时的平均教育年限选取的阈值,大致在3.6年处

按照这个分类标准,统计分析验证了作者的理论:首先,农业地理条件可以解释现代化较早的国家,灯光亮度的54%。对现代化较晚的国家,这个数字是27%;其次,贸易地理条件只能解释现代化较早国家,国内灯光亮度的6%,对现代化较晚的国家,这个数字则是17%。这一结果在多种模型设定下保持显著。作者同时换了其它几种分类标准,结果仍然保持稳健。

图5  基于1950年时的城市化率选取的阈值,大致在38%处


总之,这篇文章给我们提供了一个很有意思的思路:回看历史,未必一定需要历史上的数据,也可以挖掘凝固在当代数据中的历史。一方面,影响集聚的因素从农业地理因素向贸易地理因素转变,反映了生产力的进步;另一方面,早期农业地理因素影响的城市分布,一直留存到今天,展示了城市发展中路径依赖的特性。灯光数据的利用也是惊喜之一,期待更多这一主题的精彩研究。


文章来源:Henderson, J. Vernon, et al. “The global spatial distribution of economic activity: Nature, history, and the role of trade.” Forthcoming, Quarterly Journal of Economics.


原文链接:请点击左下方【阅读原文】


“量化历史研究”公众号由陈志武(耶鲁大学终身教授、香港大学冯氏基金讲席教授)和龙登高(清华大学社科院经济研究所教授)及其团队负责。以严肃而又不失活泼的方式,向广大学界和业界朋友,定期推送有关七大洲五大洋的量化历史研究经典文献和前沿文献。本账户同时作为“量化历史讲习班”信息交流平台,向大家及时发送讲习班的最新信息和进展。喜欢我们的朋友请搜寻公众号:QuantitativeHistory,或扫描下面二维码关注。

关注订阅号的同时,我们也诚邀八方学人发送电邮建言献策。“量化历史研究”旨在凝聚一批对历史研究有激情、有热情的朋友,共同推动以量化的方法研究经济史,金融史、政治史、社会史、文化史等各类历史题材,分享观点,共享资料。我们的邮箱:lianghualishi@sina.com。期待您的声音!


轮值主编:何石军      责任编辑:彭雪梅

点击“阅读原文”查看英文原文

56 27520 56 15533 0 0 2483 0 0:00:11 0:00:06 0:00:05 2910

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存