佳文赏析 | 《Cities》:COVID-19在中国的传播:基于CEMM模型的分析
The following article is from 城市与区域热点问题探索 Author 魏冶,王姣娥等
成果速递2019-nCoV
《COVID-19在中国的传播:基于CEMM模型的分析》
Ye Wei, Jiaoe Wang, Wei Song, Chunliang Xiu, Li Ma, Tao Pei. (2020). Spread of COVID-19 in China: analysis from a city-based epidemic and mobility model. Cities.
https://doi.org/10.1016/j.cities.2020.103010
01
摘要
趋势和采取有效的防控措施至关重要。利用多智能体网络技术和春运人口流动大数据,本文构建了基于城市单元的人口流动与疫情传播模型(CEMM)以模拟COVID-19早期在中国各城市之间的时空传播过程。与传统模型相比,该模型具有城市网络视角的特点,并强调城市间人口流动和高速交通网络的重要作用。结果表明,该模型可以较好地模拟COVID-19早期在中国的城际传播过程。通过情景模拟,本文定量评估了防控措施“封城”和“限制人口流动”对遏制COVID-19空间传播的效果。根据模拟,若此两项措施均未实施,到2020年2月,中国的病例总数将攀升至138824例,是实际数字的4.46倍。总体而言,湖北“封城”的遏制效应大于“限制人口流动”,而相对于“限制人口流动”,“封城”的效应对时间更为敏感。
02
研究背景
流行病是指能感染许多人的传染病,如流感、脑膜炎、霍乱和新冠肺炎病等。学者们一直致力于开发数学模型以更好地理解传染病传播过程(Anderson & May, 1992)。这些模型被广泛用于估计有效再生数和预测流行病的峰值持续时间或拐点,构成流行病动力学研究的主流。SIR仓室模型及其变体(如SEIR和SIRS)是分析流行病传播动力学最常用模型。而此类模型倾向将地理异质性的影响降至最低,它们存在一个共同的弱点,即很大程度上忽视流行病传播的空间信息(Arino等, 2007)。而后,学者为解决此问题,考虑疫情城际传播重要性,提出集合种群模型以表征个体在城市间的长距离移动,并与城市内部个体相互接触过程加以区分(Colizza等,2007)。若辅以人口流动数据,明确个体流动的目的和概率,集合种群模型的准确性将大大提高。但当人口规模较大或包含详细人口流动数据时,模型可能会变得复杂并需要大量计算资源(Tizzoni等, 2012),因此模型应用受限。根据原理和机理,仓室模型可视为宏观模型,集合种群模型可视为微观模型,以折衷的尺度扬长避短,在此方面,一些学者主张将手机和全球飞行网络大数据生成的人类移动模式纳入空间网络模型模拟流行病的传播(Brockmann & Helbing, 2013; Chinazzi等, 2020; Lai等, 2020)。本研究利用多智能体网络技术建立CEMM模型以模拟传染病的空间传播。与传统模型不同,该模型基于城市网络视角,强调城市间人口流动和快速交通网络对疫情传播的重要作用,有助于从地理网络的角度理解疫情传播的时空机制,制定相应防控措施。
03
研究方法与数据
每个城市感染病例的增加主要是由两个主要过程造成:来自其他城市的传播和城市内部的传染(图1(b))。
图1 (a)单中心传播模式 (b)传染病的多中心传播模式
(1)基础模型:CEMM
结合传染病的城际传输和城内扩散两部分估算每个城市的感染病例。
城际传输
在时间t从城市i输入到城市j的传染病例数由i市在时间t-1感染病例数Ni,t−1决定,以其为基数,引入流行率β(即在一个时间点上可能被感染的病例数)和流动规模影响系数γ=Pij/popui(表征i市外流到j市的比例对β值的影响)对j市城际传输病例数进行估算。
城内扩散
在时间t城市j通过内部扩散增加的病例数估算以j市在时间t-1的感染病例数为基数,采用上述流行率β值,同时考虑疫情震中区域与其他地区疫情严重程度及对疫情信息和政策响应的防控措施存在差异,引入缩减因子δ(取值0~1),以区分不同城市的防控能力。
(2)修正模型:Adapted CEMM
采用CEMM进行初步模拟分析显示,人口流入量较大的城市的传染病病例数往往被高估,而人口流入量较小的城市的病例数往往被低估。再者,远离震中的一些城市的传染病病例数往往被高估,而附近城市的病例数往往被低估。为解决这些问题,通过考虑这两种影响,对基本的CEMM模型进行改进。
规模递减效应
幂函数常被用来衡量经济学中规模收益递增或递减规律(Szakolczai & Stahl, 1969)。本研究采用幂函数将CEMM模型中流动规模影响系数γ改进为γ的n方以模拟流动规模递减的效应。通过实验发现,当n值接近1/2时,拟合效果最佳,当γ(外流人口与城市总人口的比率)增加1%时,城际传输的值增加0.5%,表明随着流动规模的增长,流动人口对疫情的传递效应是逐渐削弱的,这可以解释为什么在一些人口大量流入的城市中,新冠肺炎的传染病例数没有预期高。
距离衰减效应
为模拟距离衰减效应,在城际传输估算部分引入高斯函数G(dij,d0)(Dai, 2011),其中,dij为i市与j市之间的几何距离,d0为常数,是中国最远两个城市之间的几何距离。
综合以上规模递减效应和距离衰减效应得到改进模型 “Adapted CEMM”。
(3)多智能体网络技术
本研究以城市为基本分析单元,假设每个城市为代理节点,将城市的总人口数、感染病例数等参数作为节点属性,将城市间的人口流动作为节点间的联系,构建一个多智能体网络,亦可称之为城市网络。由此疫情的时空传播过程即可被模拟为感染病例数在城市网络中的增长和传播过程。
(4)研究数据
研究以腾讯迁徙城市间人口流动大数据为基础,将中国各城市视为节点,参照Wei 等(2018)的方法构建城际人口流动网络,如图2。各城市2018年末的市域总人口数量来源于《城市统计年鉴》和各省统计年鉴,新冠肺炎累计确诊病例数据来源于国家卫健委与各省卫健委所发布官方数据。
图2 2019年1月21日至2月9日中国城市间人口迁移
04
精度验证
考虑COVID-19症状出现与病例确诊之间存在时间延迟(Lai等, 2020; Xu等, 2020),不能直接采用报告确诊病例数评价模型精度,因此补充Lai等 (2020)所总结的中国每个县从发病到报告第一例病例的平均天数信息表,粗略计算中国每个城市每天的感染总数,利用相关分析方法对2020年1月26日-2020年2月4日的精度进行验证。由于湖北省各城市处于封锁状态,感染病例数量远高于其他城市,分别对全国各城市、湖北省各城市和湖北省外各城市进行误差分析。此外,为避免回归分析和散点图过拟合问题,我们剔除了武汉的数据。
在考虑了规模递减效应和距离衰减效应后,Adapted CEMM总体比CEMM具有更高的调整R方和更低的标准误差,全国所有城市的最高拟合精度(调整R方)达到0.854。Adapted CEMM精度明显提升,该模型具有足够的精度、准确性和描述疫情空间扩散的能力,特别是在疫情达到一定规模后。利用ArcGIS软件对Adapted CEMM模型结果进行可视化分析,新冠肺炎病例的模拟和实际分布分别如图4和图5所示。
图4 2020年2月4日Adapted CEMM估算病例空间分布
图5 2020年2月4日中国实际病例空间分布
05
模型应用与情景分析
为评价湖北省“封城”措施和“限制人口流动”措施在控制新冠肺炎传播过程中的应用效果、时机,对疫情的发展情况进行10种情景模拟,其中情景0为实际情况,情景1至情景9别为:两种防控措施均不实施、提前一周封城实际时间限流、延后一周封城实际时间限流、实际时间封城提前一周限流、实际时间封城延后一周限流、提前一周封城提前一周限流、延后一周封城延后一周限流、不实施封城实际时间限流、实际时间封城不实施限流等共10种组合情景。基于上述十个情景,分别对全国、湖北省、湖北省以外地区等三个区域的确诊病例数增长情况进行模拟(图6)。
图6 2020年1月10日至2020年2月4日不同情景下中国新冠肺炎估算感染病例增加趋势
情景8和9对比说明湖北各市封城对疫情扩散的抑制效果要强于全国限制人口流动;情景2和情景6的曲线几乎重合,说明若提前一周实施封城,限制人口流动的防控效果有限;情景2和情景3之间的病例数量差异大于情景4和情景5,说明封城的时效性比限流更强。
根据模型,截至2020年2月4日,全国所有城市(武汉除外)的感染病例中,约33.55%来自城际传输,66.45%来自城内扩散。图7(a)说明在封城前提下,在1月26日之前,感染病例主要来自于外部输入,之后则主要依靠城市内部传染,且占比持续上升。而图7(b)说明若不采取封城和限制人口流动的防控措施,情况则相反,城际传输将成为疫情发展初期的主要传染方式,并加速新冠肺炎病例的增加,同时为疫情控制带来不确定性和困难。
图7 城际传输和城内扩散导致的病例增长情况:(a)湖北封城、全国限流均实施,(b)湖北封城、全国限流均不实施
06
讨论与结论
#讨论#
随机性和不确定性是自然界的天然属性,预测自然是困难的;每个城市应对疫情的方法和强度不同,造成防控力量上存在空间差异;病例数量增长往往遵循指数规律,时序上相差1-2天亦会造成很大误差;病例诊断是一个复杂的过程,因而报告病例数不能完全反映实际感染人数也是影响模型准确性的重要因素之一;模型尚未考虑聚集性感染和超级传播者等偶然因素。
总之,由于多种影响因素存在,真正准确预测每个时间点每个城市的确诊病例数量是不可能的。但我们的研究对于揭示疫情的时空传播机制、分析流行病发展趋势、验证和提出防控方法的有效性等方面具有重要意义。
#结论#
结合人口大数据和多智能体网络技术可以有效模拟新冠肺炎在早期的传播过程。人口流动在一定程度上可以解释疫情的城际传播机制,该模型可以利用准确的人口流动数据有效预测疫情的传播过程。
封城和限制城际人口流动是非常必要的举措,并且封城措施更为重要。
人口流动对疫情的传播驱动具有规模递减和空间距离衰减两个效应。一般认为,流动人口与城市总人口应当具有同样的发病率和传播效率,但本研究的检验结果证实,随着人口流动数量的增加,感染者的输出并非成比例增加,而是呈现一定程度上的衰减。此外,研究发现距离衰减效应不仅影响人口流动数量,还影响人口流动对疫情的传递性能。
作作
者
第一作者,魏冶(1983-),东北师范大学地理科学学院,副教授,博士生导师,主要研究方向为城市网络与夜间灯光遥感。
通讯作者,王姣娥(1981-),中国科学院地理科学与资源研究所,研究员,博士生导师,研究方向为交通地理与区域发展等。
感谢:张少华、陈思佳、马丁瑜、徐期辰、孙欣、黄玉娟、何静仪、王越琳、谭爽、周雅莉等在数据搜集和图表分析中做出的贡献。
转载自 城市与区域热点问题探究
经作者授权转载
文章仅代表作者观点,与本公众号无关,版权归作者所有
原文标题 COVID-19在中国的传播:基于CEMM模型的分析
图文编辑:梁雨廷
责任编辑:李倩
审编:鲁嘉颐
终审: 顾伟男 田巍 梁龙武
猜你喜欢
扫描二维码,关注我们
都看到这里了,点个【在看】再走呗~