学术成果 | 揭示美国新冠疫情的空间位移模式
内容导读
2020年至今,我们往往会通过追踪新型冠状病毒(CovID-19)病例的分布地图,来了解不断更新的国际疫情动态。疫情分布地图多以国家、省、市等行政区划为单元,展示该单元内的流行病学统计信息,如图1所示。诚然,动态更新的疫情分布地图可以传递病例的增长信息,是最为基础的疫情展示手段之一。但由于分布地图承载的信息有限,依赖较多的主观解读,往往需要读者来回地切换当下和过去的多幅地图来识别有效的变化。因此,分布地图难以直观地展示疫情严重性在一段时间内的时空变化模式。
图 1 国家尺度累计病例的全球疫情分布地图(来源:https://en.wikipedia.org/wiki/COVID-19_pandemic_by_country_and_territory,截止2021年3月22日)
在本研究中,我们设计了一种网络优化的方法,利用随时序变化的疫情分布地图来推算疫情“重心”的空间位移(spatial shift)过程,从而反映CovID-19“严重性”是如何随着疫情发展而在空间中移动的。以美国2020年1月至8月的早期新冠疫情发展阶段为例,我们揭示了在社交隔离和地理隔离的综合作用下,美国疫情重心在各州之间的时空位移模式。
结果表明,美国CovID-19疫情的早期发展各阶段中可识别出稳定的全局空间位移模式,包含长程和短程交互。同时,疫情的空间位移指标可帮助我们定量地刻画疫情发展各阶段的相似性和差异性。另外,通过观察局部空间位移,能够发现地区间的疫情空间溢出及空间聚集等动态关系。
该论文于2021年4月发表于自然《Nature》旗下的综合性刊物《Scientific Reports》。
从疫情“分布”地图到疫情“位移”地图
图 2 美国新冠早期的六个阶段及其对应的疫情空间位移模式。(A)从2020年1月31日至8月9日的累计确诊病例变化;(B)对应六个阶段的七幅州疫情分布快照地图;(C)推算得到的六个阶段的疫情位移地图。
根据CNN报道的疫情相关新闻以及纽约时报公开的疫情病例数据,我们选取了自2020年1月31日至2020年8月9日之间的7幅疫情确诊病例的分布快照地图(以州为空间单元),考虑其时间线上的六个阶段:P1:1月31日-3月13日,自美国宣布对中国的旅行禁令(travel ban)起至美国政府宣布进入国家紧急状态;P2:3月13日-3月31日,美国境内各州的居家令(stay-at-home order)逐步实施;P3:3月31日-4月28日,达到一百万确诊病例;P4:4月28日-6月11日,达到二百万确诊病例;P5:6月11日-7月23日,达到四百万确诊病例;P6:7月23日-8月9日,达到五百万确诊病例。如图2A 所示,时间线每日每个州的累计确诊病例数据均可以公开获取得到(关于各阶段人口移动性数据和对政治经济环境的描述请查阅原文)。
对于时间线上的7个主要节点,可以绘制得到对应的疫情分布快照地图,如图2B所示。接着,我们设计了一个网络优化算法:以疫情确诊病例数在两个时刻的变化值作为限制条件,以最小化疫情空间位移的总成本作为优化目标,综合考虑距离衰减(地理隔离)以及人口移动性(社交隔离)等因素定义疫情的单位位移成本,求解最优的空间位移模式。在定义地理隔离时,我们选择空间交互建模时常用的重力模型的逆形式,确保长程位移的高成本以及重要位置间位移的低成本。在定义社交隔离时,我们使用Twitter的人口流动数据,刻画州际的移动性成本。该优化算法可看做是对之前研究《基于连续时相的空间分布快照推算空间交互模式》(可点击查看)提出的IIDS方法的具体改进。
图2C展示了对于六个不同阶段计算得出的疫情“位移”地图。以流地图的方式可视化,图中流的箭头反映空间位移的方向信息,以病例数衡量空间位移的强度,流的颜色和粗细通过位移强度的线性变换反映。在六个阶段中,可以直观地识别出较稳定的疫情位移格局:加州、纽约州、德州以及伊利诺伊州扮演了网络中主要的枢纽节点。同时,较强的长程位移持续出现在加州-纽约州,纽约州-伊利诺伊州,加州-德州,德州-纽约州之间。这些枢纽节点的疫情位移呈现出较了为一致的规律:从较远的州接受输入位移(in-shifts),同时向其周边的低风险地区输出位移(out-shifts)。在P4,P5,P6等后期阶段,新泽西州、麻塞诸塞州、佐治亚州以及佛罗里达州开始出现强的out-shifts,表现出后续疫情爆发的潜在风险。此外,我们还发现具有更大经济规模和人口规模的州倾向于产生更强的疫情空间位移。关于居家令的实施和政策失效等社会经济因素对各阶段疫情发展的影响,请参见论文及其补充材料。
空间位移揭示疫情全局和局部动态
图 3 空间位移指标定量描述疫情发展,六个颜色反映六个阶段。(A)日均位移强度的概率分布变化;(B)唯一强度与新增确诊病例数的相关性散点图;(C)日均位移成本箱线图
基于疫情的空间位移信息,我们使用几个相关的指标进一步地定量刻画疫情是如何随时间发展的。首先,我们给出美国州之间的日均疫情位移(daily shift)指标,以反映对应的发展阶段内的平均每日疫情位移强度,从而公平地对比不同阶段之间的疫情严重性。图3A展示了六个阶段的日均疫情位移强度的概率分布。可以看出,即使美国针对其初期的疫情发展推出了一系列防疫措施,全局的日均疫情位移强度在P2~P6期间几乎仍然是类似的,疫情仍在逐步变严重。其次,我们评估了每个阶段每个州的新增确诊数与其疫情空间位移的相关性,如图3B所示。总位移和新增病例间可见显著的正相关(Pearson R=0.86, p≈0),而输出位移(out-shift)与新增病例的相关性(Pearson R=0.68)略大于输入位移与新增病例的相关性(Pearson R=0.42)。此外,我们还发现上一阶段的daily shift与下一阶段的日增病例数有着较强的正相关(Pearson R=0.72, p≈0; Spearman R=0.75, p≈0),说明可以利用历史的疫情位移信息来预测未来的病例增长。第三,我们引入了日均位移成本(daily cost of spatial shifts),综合考虑位移强度和位移发生的难度,来评估不同阶段的疫情严重性和复杂性,如图3C箱线图所示。相关讨论详见论文及补充材料。
图4 A. 20%采样率下的训练场所和测试场所示意; B.推测测试场所的七维社会功能特征所用的图卷积神经网络模型
除了关注全局尺度下的统计指标之外,本文提出的方法还可以帮助我们理解局部和区域的疫情动态。局部的输入位移in-shifts或输出位移out-shifts可以帮助评估各地的疫情控制政策是否有效,或是推断周边区域的疫情爆发风险。图4A展示了纽约州从P2到P5的局部空间位移模式。可以看出,纽约与其周边各州的局部关系呈现出了从“黑洞”(P3)到“火山”(P5)的变化过程。在P3阶段,纽约州更多地吸收周边的in-shifts,这也是其病例增长最快的阶段。而在P4和P5时,纽约则开始向周边的东北部各州输出out-shifts。图4B通过时序散点图的方式展示了各州的疫情in-shift和out-shift的关系变化,图中的连线为纽约的变化情况。可以看出,在P2和P3之间,纽约有显著的out-shift降低和in-shift增加,体现了疫情的局部集聚现象。而在P3之后,纽约开始大量地增加out-shifts,反映了局部的疫情空间溢出效应。
总结
1. 从空间位移的视角提出了一种全新的用于追踪新冠疫情的地图方法,不再局限于当下常见的疫情空间分布地图,而是通过推算疫情分布背后的潜在二阶交互信息,揭示疫情的空间位移模式。
2. 空间位移的各类统计指标可用于定量评估疫情的发展过程。
3. 基于疫情的空间位移信息,可以直观地描述和推测疾病传播过程中的复杂局部动态,如空间溢出和集聚等。
总结而言,本研究基于网络优化方法,推断疫情快照数据之间的空间位移模式,并且利用疫情空间位移信息来回顾、追踪、预测疫情过程,可以为疫情在地理空间上的传播提供一种新的叙事方式。类似的思路可被应用于其他动态空间过程的场景中。
参考文献
[1] Di Zhu*, Xinyue Ye, Steven Manson. 2021. Revealing the spatial shifting pattern of COVID-19 pandemic in the United States. Nature Scientific Reports, 11, 8396. https://doi.org/10.1038/s41598-021-87902-8
[2] Di Zhu, Zhou Huang, Li Shi, Lun Wu, Yu Liu*. 2018. Inferring spatial interaction patterns from sequential snapshots of spatial distributions. International Journal of Geographic Information Science, 32(4): 783-805. https://doi.org/10.1080/13658816.2017.1413192
代码
https://github.com/dizhu-gis/CovIDSpatialShifts
https://github.com/dizhu-gis/IIDS-Inferring_Interactions_from_Distribution_Snapshots
素材来源:S3 - Lab
材料整理:朱递
内容排版:侯远樵