查看原文
其他

Nature最新:人口流动可预测疫情传播,并揭示我国确诊数据真实可靠

刘世康 集智俱乐部 2021-02-09

       

导语

为应对新冠疫情,封城措施被广泛使用。如何来量化封城产生的效果呢?最近,多家中国学术机构与美国耶鲁大学合作,论证了封城措施毫无疑问是有效的。论文于4月29日作为加速出版的论文发表在Nature杂志。


耶鲁大学新闻稿中提到:“论文证实了中国疾病防控中心发布的数据,因为电信运营商作为一个完全独立的信息来源,与官方报告的新冠肺炎确诊病例数具有很好的相关性。”这是最负盛名的学术机构之一在这个重要时刻支持我们国家的强烈声明!


2020年1月23日,正值春运,武汉市封城。封城措施究竟有多重要呢?最近发表的一篇论文给出了答案。


国际顶级期刊Nature杂志于4月29日刊登论文《人口流动驱使了新冠肺炎疫情的传播》。该研究使用海量手机用户定位数据(汇总的群体数据,不涉及隐私),追踪了封城前武汉流出到全国各地的人口流动情况,并据此分析疫情传播全过程。


研究显示,武汉市及湖北省封城是非常正确的决策,及时截断了大量感染的疫情源。数据客观地反映出,各个城市中有武汉旅行史的人数越多,确诊病例数也越多。


研究还发现,仅根据人口流动情况就可以非常准确地预测新冠疫情爆发的时间、地点、强度。这意味着可以通过实时观察人口流动来制定有针对性的抗疫措施。



论文题目:

Population flow drives spatio-temporal distribution of COVID-19 in China

论文地址:

https://www.nature.com/articles/s41586-020-2284-y  


封城措施的效果立竿见影


武汉作为九省通衢,是交通枢纽城市,在春运期间有大量人口流动。为防止疫情扩散,千万级人口的武汉在除夕的前一天采取了封城措施,其规模之大,史无前例。


研究证明,封城措施在大幅减少人口流动方面非常有效。论文基于移动大数据分析发现,封城之后,出城的活动几乎完全停止。从1月22日到23日,人口流出下降了52%,1月24日(除夕)进一步下降了94%


图中清晰地显示出在封城之后,从武汉流出到各地的人口数目锐减。


       

图1:武汉流出人口数量随时间的变化



封城措施阻断疫情传播


经上述分析可知封城措施对减少人口流动的效果显著。那么封城是否真正对疫情防控有效呢?


研究表明,由国家卫健委报告的各个城市的确诊病例数与各城市有武汉旅行史的人数成高度相关。也就是说,在疫情初期,武汉流出人口可能会将新冠病毒携带至其他地区,进而引起当地疫情的传播。


图中显示了全国各地的疫情与当地有武汉旅行史人数的重合度。容易发现,武汉流出人口数量(即有武汉旅行史的人数)越多的地区,确诊病例数也越多。

       
图2:确诊病例数和武汉人口流出量在全国各地的分布情况


截至2月19日数据,各城市确诊病例数和武汉流出人口数量的Pearson相关系数高达r = 0.952,具有统计显著性。下图是对这种相关性的直观展示。高相关性意味着可以通过人口流动的数据来精准预测各地确诊数。

       

图3:各城市确诊病例数和武汉流出人口数量呈高度相关



预测疫情发展最准确的指标


除了武汉流出人口数量这个指标外,是否有其他指标与各地确诊病例数有相关性呢?文章分析了其他几项指标: 


1. 各地百度搜索与疫情相关词汇 (例如新型冠状病毒、流感、SARS、非典型肺炎、口罩等)频率

2. 各地人口数

3. 各地GDP

4. 各地距武汉的距离


通过比较,发现武汉流出人口数量与确诊数的相关性最高,而其他指标与确诊数相关性较低。有趣的是,距离武汉越远的地区并不意味着越安全。交通不发达时,传染病的传播会随着距离变远而减弱。而随着现代交通业的发展,传染病可能会传播到地理位置很远但是人口交流频繁的城市。

       

图4:累积确诊数与各因素间相关性


另外,武汉流出人口数量与确诊数的相关性经历了从低到高的变化。这很可能是全国严格防控措施下的结果。在严格防控下,各地疫情发展才会像严格按从武汉流出人口比例来分配,且绝大部分的感染只发生在家庭内部。



数学模型精准预测各地疫情


基于上述发现,文章建立了风险源模型 (risk source model)。顾名思义,该模型利用人口流动数据来评估流行病从某个源头向各地传播的风险。研究发现,该预测模型可以至少提前一周预测全国范围内感染的病例情况,并且准确率非常高(R^2=0.927)。

这一模型可以用来监测和预警疫情的早期发展,其结果可用于评估各地的疫情风险大小,在疫情发展的早期为应急方案和相关决策提供依据。

模型还可以告诉我们各地应对疫情的表现。预测值可以作为一个衡量标准。如果确诊数高于预测值,则说明应对表现较差(图中红点),疫情在当地的传播可能受到其他风险印度的驱动。如果确诊数低于预测值,则说明应对表现较好(图中黑点)。
       

图5:基于人口流动的预测模型。曲面为各地区预测值。红点表示报告确诊数高于预测值。黑点表示报告确诊数数低于预测值


论文最后指出,除手机数据外,其他反映人口流动的数据,如火车票、汽车高速费等数据,也可以用来预测疫情的传播。另外,论文中的方法也可以采用实时数据来为人力、物资的调配提供依据。


论文使用的累计群体数据、累计病例数据等以及相关分析代码已随论文公布在Nature网站上。(https://www.nature.com/articles/s41586-020-2284-y)


论文作者:香港大学贾轼、国防科技大学吕欣、西南交通大学袁韵、湖南工商大学徐戈、 深圳高等金融研究院贾建民、耶鲁大学Nicholas A. Christakis。


相关阅读:


耶鲁大学新闻稿:

https://news.yale.edu/2020/04/29/researchers-devise-new-model-track-covid-19s-spread

深圳高等金融研究院新闻稿:

https://mp.weixin.qq.com/s/tgb-AOqsnqDVEF3MSewREQ

亚洲科学家杂志新闻稿:

https://www.asianscientist.com/2020/04/in-the-lab/mobile-phone-data-track-covid-infection-wuhan-china/



作者:刘世康

编辑:张希妍



推荐阅读


武汉新冠肺炎传播与控制简单的数学模型与预测
从复杂网络小世界、无标度、高聚类特性看新型冠状病毒肺炎
Nature呼吁:应对21世纪的大规模流行病,各个学科必须联合起来
网络上的流行病传播与预测 |《巴拉巴西网络科学》新书推荐
召唤热爱科学,乐于探索的你 | 2020 集智俱乐部志愿者招新






集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

◆ ◆ ◆

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

让苹果砸得更猛烈些吧!



👇点击“阅读原文”,了解更多论文信息

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存