查看原文
其他

超越经济普查:从航空影像判断城市中的贫富差距

Leo 集智俱乐部 2022-04-08

导语随着城市化的进程,大都市、城市群正在逐渐形成。然而,进了城并不一定就是有钱的城里人,一个城市的内部也存在着极大的贫富差距、经济发展不均衡等现象。Jacob Levy Abitbol 与 Márton Karsai 通过航空影像数据预测了城市的经济水平并从城市的拓扑几何结构上给出了解释。这一研究于2020年10月发表在 Nature Machine Intelligence 上。


全世界生活在城市中的人口数量从近一个世纪前的13%已经增长到了55%。这种城市化的进程在未来几年可能还会持续下去。然而对于大型城市、城市群而言,高速发展的副产品之一就是不平等现象的急剧增加。传统上的GDP、CPI、人口普查等数据就提供了反应经济发展水平的作用。

 

然而,为了更好地解决这类发展不平衡、不均衡问题,传统的统计数据已经无法满足我们的需求,我们需要获取细粒度的社会经济信息,也需要新的经济统计指标。

 

随着现代信息技术的发展,除了数值型的统计指标外,现代的科学家也开始从多媒体等非结构化数据中推断经济发展的信息。例如卫星遥感、航拍影像数据就为预测经济发展提供了新的数据来源。利用现代机器学习技术,通过图像数据和经济调查信息的拟合训练,研究者就可以通过图形数据来估算一个地区的社会经济状况(socioeconomic status,SES)

 

然而,深度学习的可解释性问题,也给这一新方法带来了限制。例如,城市几何结构和高分辨率影像之间没有建立起关系。近日,来自法国里昂大学的 Jacob Levy Abitbol 和 Márton Karsai利用深度学习模型以及相关的解释方法,通过航空影像数据预测了城市的经济水平并从城市影像的几何结构上给出了解释。这一研究于2020年10月发表在 Nature Machine Intelligence 上。

      

论文题目:

Interpretable socioeconomic status inference from aerial imagery through urban patterns

论文地址:

https://www.nature.com/articles/s42256-020-00243-5


有钱没钱拍照就知道:

从航拍影像预测经济水平

 

在这项研究中,研究者一共使用了三个数据集,分别是法国2015年的社会经济普查数据、2013-2016年间的航空影像数据和2012年的城市地图。

      

图1:法国巴黎地区的数据集示意图。图a,5 km × 5 km的航拍图象;图b,经济收入的空间分布,每一方格表示200 m  × 200 m(蓝色表示经济发展较低的地区,红色则表示经济发展较好的地区);图c,城区土地使用类型示意图,不同的颜色表示不同的土地使用类型(例如,工业商业区、运动休闲设施、道路、河流水域等)

 

为了识别航拍影像数据,研究者使用了一个修改过的EfficientNet B0模型。EfficientNet是一个由谷歌提出的可用于图像识别、迁移任务的模型。在研究者的实验中,通过识别航拍影像,实验模型给出的预测数据和真实的经济统计结果非常吻合。

         

图2:以巴黎为例的社会经济状况预测数据-观测数据混淆矩阵。

 

进而,研究者也通过EfficientNet B0模型绘制出了巴黎地区的社会经济状况地图。


图3:巴黎地区的收入地图(左图)与模型预测出的收入地图(右图)。着色从冷到暖表示社会经济状况地图数值从低到高。

 


到底是哪里拖了经济的后退:

归因分析让贫富差距看得见

 

为了进一步提高机器学习模型的可解释性,研究者使用了guided Grad-CAM(guided gradient-weighted class activation mapping)——一种基于梯度的热力图模型将卷积神经网络的抽象运算映射回城市的地理空间。

 

对下图所示的一个特定区域而言:

       

图4:一张航拍影像

 

通过guided Grad-CAM给出的图像我们可以知道在一张影像中,哪些区域会被识别为贫穷区域,哪些地区会被识别为富裕区域


图5:guided Grad-CAM给出的贫穷(b)和富裕(c)区域热力图。正是那些被激活的高亮区域表示了不同的经济发展水平以及对应的几何区域划分(e-f)

如上图 b-c 所示,算法识别出的贫穷和富裕地区均以热力图的形式进行了着色。进而,我们就可以得知是城市中的哪些几何结构表示了贫穷或富有的区域(e-f)

 

经济发展不平等的加剧并不仅仅出现在国家、城市之间。实际上在一个大型的城市、城市群中,也存在着细微但巨大的差异。雨果奖获奖小说《北京折叠》就以科幻的方式为我们描述了这种巨大的鸿沟。

 

面对难以准确采集的经济数据和传统统计数据的滞后性,新兴的以数据驱动的研究方法和范式能为我们提供更加精细化的、多角度的经济数据,打破区域内部的隔离,填平经济发展间的鸿沟。


作者:Leo审校:赵雨亭编辑:邓一雪


集智斑图顶刊论文速递栏目上线以来,持续收录来自Nature、Science等顶刊的最新论文,追踪复杂系统、网络科学、计算社会科学等领域的前沿进展。现在正式推出订阅功能,每周通过微信服务号「集智斑图」推送论文信息。扫描下方二维码即可一键订阅:



推荐阅读


生命复杂性系列读书会
怎样预测城市人口增长?Nature刊文提出超越Zipf法则的统一模型
Nature揭示人类流动性之谜:层级性与幂律共存
Science Advances前沿:创新型城市的临界人口是120万
什么样的城市更宜居?层级性比城市大小重要
加入集智,一起复杂!




集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

◆ ◆ ◆

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

让苹果砸得更猛烈些吧!



👇点击“阅读原文”,追踪复杂科学顶刊论文

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存