查看原文
其他

使用机器学习预测快速变化的交通复杂网络

刘志航 集智俱乐部 2022-10-24


导语


交通网络在人类流动和货物交换中起着关键作用,但它们也是传染病在世界范围内传播的主要渠道,并占二氧化碳排放量的很大一部分。最新发表于 Nature Communications 的一篇文章,使用机器学习的方法研究了两个成熟但快速变化的交通网络的连边移除动力学,发现交通复杂网络中的连边动力学不是随机的,可以根据局部网络拓扑结构做出准确的预测。机器学习方法预测交通网络长期演变的能力,可以帮助建立规划未来基础设施的情景,并能为应对气候变化和节能减排提供参考。


研究领域:复杂网络,城市计算,机器学习,交通预测

刘志航 | 作者

邓一雪 | 编辑


 

论文题目:

Forecasting the evolution of fast-changing transportation networks using machine learning

论文链接:https://www.nature.com/articles/s41467-022-31911-2



交通运输网络是重要的基础设施,但流感和新冠等流行病也通过交通网络快速传播。同时,交通也是温室气体排放的一个重要因素,在美国所有的交通部门中,航空网络占美国温室气体排放的9%,占全球温室气体排放的10.6%。随着气候剧变,极端天气以及全球公共卫生事件不断增多,交通网络的组织方式将不可避免地发生巨大的变化。因此,对于规划者来说,能够预测交通网络在未来几十年的发展是至关重要的。
 
对于成熟的交通网络,结构的变化主要是由于连边的增加和移除,其连边动力学是企业出于竞争和利润的动机、政府出于国家利益的考量以及历史偶然事件的结果,往往很难预测。过去,人们主要在链路预测和网络增长模型的背景下研究连边的增加,而对交通网络连边边的移除则是在网络渗流、攻击和容错、移除策略、灾难性故障、同步和相位转换、以及级联故障等背景下进行研究。然而,现实世界的时空网络中的连边移除并不像渗流过程那样不受约束地增长,而且决定连边移除的机制也不是很清楚。
 
 



1. 机器学习预测交通网络连边的动力学




机器学习方法已经成功地应用于研究人类流动性、交通基础设施的可持续性以及COVID-19 对能源需求的影响。因此,论文作者采用类似的方法来探究交通网络中连边的动力学变化。这项工作研究了两个大型的成熟但快速变化的交通网络的连边动力学:巴西城市间公共汽车运输网络和美国国内航空运输网络。
 

图1. 两个全国性交通网络的连边动力学。(a)每个圆圈的大小与代表该位置城市的节点的度数成正比。(b) 两个网络每月移除的边的比例。

 
作者将交通网络每月的连边分为保留(retained)和移除(removed)两类标签,并将连边权重(车次/航班数)和11种网络拓扑特性作为特征(图2b),发现保留的连边的特征和移除连边的特征之间有统计学上的显著差异。在考虑加权拓扑特征的情况下,使用 XGBClassifier 算法的预测准确率可以达到 0.69(巴士)和 0.71(航空),这些结果表明,通过机器学习方法,可以使用交通网络的拓扑特征来区其中连边的时空动力学。 
 

图2. 用于预测交通网络快照中保留和移除连边的机器学习模型的性能。(a)在网络中创建训练和测试集的过程说明。(b)为每个连边计算特征,并比较训练集中保留和移除连边集的特征分布。(c)评估了27种常见的监督分类算法的性能,并显示前8个算法的结果。作者重点关注了 XGBClassifier 算法,因为它在高性能算法中具有最低的误差方差。

 
 



2. COVID-19大流行期间的

模型性能依然稳定



 
新冠疫情对全球交通网络产生了强烈的冲击,特别是经济衰退加上出行限制导致航空运输需求的骤减。在2020年2月至2020年4月期间,美国国内航班的月乘客数量从7000万崩溃到287万。这种特殊情况提供了一个自然的实验,用来测试机器学习方法在面对外部冲击时继续做出准确预测的能力。
 
研究发现,尽管疫情期间乘客数量急剧减少,但每月从航空运输网络中移除的连边的比例与疫情前的观察结果相似(图3a),这表明即使在疫情后,用来决定哪些连边需要移除的特征保持一致(图3b),其中枢纽发展指数(hub promoted index)和资源分配指数(resource allocation index)是预测连边移除的两个主要特征。即使在出行限制后的几个月里准确率略有下降,但得到的平衡准确率却非常相似。
 

图3. 在强烈的外部冲击期间预测美国航空运输网络中的连边移除。(a)尽管在疫情期间乘客数量急剧减少,但每月移除的连边部分仍与大流行前的情况相似。灰色阴影区域强调了本次分析获得的新数据。(b)同步测试的平衡精度与时间的关系表明,在出行限制造成的外部冲击下,模型能够识别出被移除的连边。(c)根据旅行限制期间每个快照的 SHAP 值对特征重要性进行排序,特征重要性与疫情前类似。(d)非同步测试的结果对于疫情前后的出行限制都是一致的。

 
作者分析表明,不加权的拓扑特征具有更稳定的预测,且不受交通网络初始条件的影响,也就是说,选择哪个月来训练这个模型。相比之下,只考虑连边权重的模型误差却非常大,在长期预测中表现不佳。因此,交通复杂网络中的连边动力学不是随机的,可以根据局部网络拓扑结构做出准确的预测。
 
 



3. 不同交通网络的耦合与应对气候变化




政府监管、并购、破产保护、流行病以及自然灾害等各种各样的因素会影响交通网络的动力学,因此交通网络动力学变化是非线性的。而机器学习的方法在预测聚合网络的变化时能够达到这样的准确性,对于未来的交通规划十分有意义。
 
以往的研究发现,取消一部分航空连接可能会导致 3-8 小时范围内的汽车通勤增加。由于道路的建设、扩建和维护以及汽车行驶里程的增加,这会导致二氧化碳排放量的增加。因此,需要探索不同交通网络的多层结构之间的相互作用。例如,使用机器学习方法来探索一个网络(例如,航空运输网络)中连边移除与另一个交通网络(例如,高铁)中连边增长之间的相互作用将会对未来的减排政策非常重要。
 

复杂科学最新论文


集智斑图顶刊论文速递栏目上线以来,持续收录来自Nature、Science等顶刊的最新论文,追踪复杂系统、网络科学、计算社会科学等领域的前沿进展。现在正式推出订阅功能,每周通过微信服务号「集智斑图」推送论文信息。扫描下方二维码即可一键订阅:




推荐阅读



点击“阅读原文”,追踪复杂科学顶刊论文

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存