3S战“疫”|利用手机数据进行新冠疫情时空扩散推估
本文即将发表于《武汉大学学报·信息科学版》第5期“COVID-19”专栏
论文题名《交通分析区尺度上的新型冠状病毒肺炎时空扩散推估方法:以武汉市为例》
冯明翔1 方志祥1* 路雄博2 谢泽丰2 熊盛武2 郑猛3 黄守倩1
1 武汉大学测绘遥感信息工程国家重点实验室
2 武汉理工大学计算机科学与技术学院
3 武汉市交通发展战略研究院
现有的流行病学模型大都通过对统计数据进行拟合,实现对患病人数的推估,较少考虑细粒度空间人群移动交互对时空扩散特征的直接作用。
本文通过把空间交互特征融入流行病学模型,基于手机用户空间交互数据的新型冠状病毒肺炎时空扩散推估方法,对2019-12—2020-03 在武汉市爆发的新型冠状病毒肺炎患病人数以及时空扩散过程进行推估。2020-02-18 后的累计推估患者结果与官方公布患者总量吻合非常好,差距约占5.6%,间接验证了前期推估的合理性。
本文方法能比较有效地推估细粒度空间之间的传染病传播,对正确认识细粒度空间的人群交互对传染病时空扩散影响机制,增强宏观上流行病学模型的空间可解释性具有一定科学意义。
扫描上方二维码下载全文
========以下为全文,建议收藏后阅读,大约需要15 min=======
2019 年12 月武汉爆发了新型冠状病毒肺炎,出现公共卫生事件危机,由于目前尚未发现有效根治方法,政府为了控制传染病的急剧扩散,采取了大量有效的管控措施,如关闭城市、关闭居住小区、暂停公共交通等方式,并对城市内人群进行大规模检测和防控,取得了较好的效果。
传统流行病学模型,如SEIR、SEIRS 、SEIQR、SIR-X等模型大都是根据官方发布的传染病数据(如确诊患者数量、疑似患者数量等)对疫情的扩散和传播进行推估传染病的感染人数推估。这些模型的建模大都停留在统计层面,较少考虑到细粒度空间交互对传染病扩散的影响作用,会造成模型推估出的时空传播结果与实际情况存在差异,而且不具备细粒度空间上的可解释和适用性。
本文通过收集得到的2019-12-10—2020-02-15 武汉市手机数据,从手机数据中提取得到武汉市疫情爆发期间不同交通分析区(traffic analysis zone, TAZ)内人群移动交互特征,并基于这些特征直接提取影响流行病学模型的关键参数,实现基于手机数据的COVID-19 时空扩散推估。
本文首先分析不同时间段内武汉市交通分析区间的人群移动交通特征,进一步计算得到不同交通分析区内人群的日均接触次数(k),作为每个交通分析区的SEIQR 模型关键参数,推估每个交通分析区内部和不同交通分析区之间传染病的相互传播,进而推估传染病在武汉市内的时空扩散过程,最后通过收集得到的武汉市社区发布的公告信息,验证了本模型的推估结果的可靠性。
1
数据描述
本文采用的数据是武汉市2019-12-10—2020-02-15 的某公司手机定位数据,利用250 m×250 m 的规则空间格网对武汉市区进行划分,得到每个网格内每天的人口驻留数量和格网之间的空间交互数量。
根据不同运营商的占比,该公司手机用户占武汉市总人口约27%,采用扩展系数(3.7)对本数据集合进行扩样,估算得到武汉市的人口驻留和空间交互分布情况。
交通分析区(traffic analysis zone, TAZ) 是由交通管理部门根据城市交通主干道进行划分,并用于分析城市人口通勤特征的空间统计单元。每个TAZ 包含若干个住宅小区,武汉市实行的小区封闭隔离主要是针对住宅小区开展。
本文选择武汉市城区1 140 个交通分析区作为地理分析单元。
为了获得每个交通分析区内的人口数量和交通分析区之间的空间交互人数,本文首先计算所有规则格网的中心点位置,并将其与交通分析区进行空间拓扑叠加分析,得到格网中心点所处的交通分析区,从而确定每个格网所属的交通分析区(如图1 所示),推算出每个交通分析区内的人口数量以及交通分析区之间的空间交互人数。
图1 武汉市城区1 140个交通分析区与250 m×250 m格网空间分布
政府在2020-02-17 出台了全面封闭住宅小区的措施,本文假设2 月15 日之后人口驻留数量与2 月15 日相同,人群日均接触次数(k)每天下降60%。此外,本文还收集了2020 年2 月4 日—21 日的各个社区所通报的确诊患者数量,用于对本文所提出方法推估结果进行验证。
2
基于手机用户空间交互数据的COVID-19 时空扩散推估方法
本文提出基于手机用户空间交互数据的COVID-19 时空扩散推估方法,主要工作集中在两个方面,利用手机数据计算交通分析区人群日均接触次数,基于SEIQR 模型构建交通分析区尺度上的COVID-19 时空扩散推估方法。
交通分析区的人群日均接触次数计算方法
人群日均接触次数反映不同区域中个体与个体之间的接触频率,对传染病传播产生重要的影响,是对流行病感染人数推估的重要参数。
流行病学研究认为这一参数与人口密度和交通出行便捷程度成正相关。本文针对不同TAZ 的人口密度和交通出行便捷程度,提出不同交通分析区的人群日均接触次数的计算公式:
计算过程如下:
首先利用TAZ i 内的人口数和交通分析区面积,计算TAZ i 的人口密度;
其次,本研究假设TAZ 的交通出行便捷程度与该TAZ 内出行人数在人口总数中的比例和该TAZ 内个体平均活动面积正相关,因此,根据手机数据推导得到TAZ 之间空间交互数量,包括每天进入TAZ i 和离开TAZ i 的人口数量;
TAZ i 内个体的平均活动面积的计算则是根据TAZ i 与其他TAZ 之间的空间距离,计算所有进出TAZ i 的人群移动总距离,以及根据当天TAZ i 内的人口总数量计算得到求得该TAZ i 内个体的平均活动距离,并将该距离的平方作为TAZ i 内个体平均活动面积,以此计算每天TAZ i 内人群日均接触次数。
交通分析区尺度上的COVID-19 时空扩散推估
本文利用上述计算TAZ 人群日均接触次数,针对每个TAZ 的每天的新冠肺炎确诊患者人数(confirmed patients, Con)进行推估。根据流行病学模型SEIQR,本文将传播分为不同TAZ 间的传播和TAZ 内部的传播两个层次。
假设每天存在部分疑似病人(suspected patients, Sus)换转化成确诊病人(Con)的转化率为α,部分处在治疗中的确诊病人(hospitalized patient, Hos)会治愈变为正常状态的人群(normal people, Nor)的治愈率为𝜒。因此TAZ i 每天的新增的确诊病人数量为:
相应地,TAZ i 到第t天确诊病人的累计量为:
式中,参数α=1/4.8,χ=1/20,是直接参考流行病学对SARS和COVID-19研究;
各参数的具体意义见原文。
3
实验与分析
武汉市TAZ 间人群交互强度的时空变化结果分析
在人口数量方面,武汉市人口数量在12 月期间稳定在1 300 万人左右,在2020 年,受春运影响武汉市人口总量逐渐下降,在1 月24 日人口数量降至约900万人。
图2 给出了疫情期间武汉市TAZ 间空间交互总量变化曲线,该曲线显示:
图2 武汉市TAZ间空间交互总量的变化曲线
在2019 年12 月期间,各个TAZ 间的空间交互总量在1 300 万次上下震荡,进入春运(2020-01-10)后,空间交互总量出现了小幅度的下降,在1 200 万次左右徘徊,可能的原因是:1 月10 日前后武汉市各大高校以及部分企业开始放假,人口的减少导致不同TAZ 间的交互数量出现了小幅度下降。
但是在2020 年1 月20 日晚,钟南山院士首次确认出现人传人的现象后,TAZ 间的空间交互总量出现了一定程度的下降,从1 000 万下降到790 万左右,人们通过减少空间交互来避免受到感染。
随后,武汉市政府出台了一系列管控措施,包括关闭城市、暂停公共交通和出租车、限制私家车上路、关闭小区等,进一步导致了各个TAZ 之间空间交互总量的逐渐下降,并在1 月26 日达到最低(86 万次左右)。
图3 给出了疫情不同发展阶段4 天的TAZ 空间交互数量空间分布图,具体日期为:2019-12-10、2020-01-17、2020-01-21、2020-01-26,分别对应正常情况下、春运期间、确认人传人后以及政府出台相关措施后的空间交互空间分布情况。
表1 统计了这4 天对应的空间交互总量超过250、1 000、2 000 和3 000 次的TAZ对数量。
通过分析图3 和表1 可以发现:
2019-12-10(正常工作日)的TAZ 间交互强度属于平常的水平,超过3 000 次的TAZ 对有37 个,而且呈现的片区分布比较明显;
2020-01-17 TAZ 间交互出现小幅下滑,表现明显是高校所在的区域,总体上超过3 000 次的TAZ 对下降到14 个;
2020-01-21 TAZ 间空间交互量继续出现下降,只有少量超过3 000 次TAZ 对,并且超过250 次的TAZ 对数量由1月17 日的4 207 下降到2 205,短距离的交互居多;
到1 月26 日,超过2 000 的TAZ 对都消失了,只有43 个TAZ 间存在超过250 次以上的少量空间交互,说明政府政策有明显的限制人群流动效果。
TAZ 级别的疫情时空扩散推估结果
利用本文方法推估出了武汉市在2019-12-10—2020-04-04 期间每天的患病人数。图4 给出了疫情发展过程中6 天(2019-12-31、2020-01-07、01-14、01-21、01-28 和02-04)的TAZ 患者分布图。
从所推估病人所处的交通分析区数量变化上看,前期由于患者数量较少,存在病人的交通分析区数量也较少,随着病毒不断加速扩散,受到感染的交通分析区在2019-12-31 开始不断增加(如图5 所示),空间扩散效应明显,由当天的7 个交通分析区增加到02-04 的882 个交通分析区。
表2 给出了推估的患者数量及其小区数量的统计结果。
根据计算结果可知:
到01-07,已有147 个交通分析区出现了患者,占全部交通分析区的13%,且不断在空间上扩散,距离汉口地区较近的交通分析区都出现了患者;
到01-14,出现患者的交通分析区达到468 个,并进一步扩散,部分距离城市中心较远的交通分析区出现了患者,武昌片区也开始出现病患小区;
到01-21,传染病在空间上进一步扩散,有698 个交通分析区出现患者,超过10 个患者的交通分析区数量达到60 个,并且有3 个交通分析区出现50 个以上的确诊病例,武汉三镇出现明显的空间聚集效应;
01-28,空间扩散速度开始变慢,共有804 个交通分析区出现病例,但病情严重的小区不断增多,有8 个交通分析区出现了超过100 例确诊病人,并主要分布在汉口地区,但已经覆盖大部分武汉TAZ 区域;
到02-04,出现超过100 例病人的交通分析区开始由汉口地区往其他地区扩展,汉阳地区和武昌地区开始出现超过100 例病人的交通分析区,总数达到44 个,占比约3.9%。
推估有疫情TAZ 的验证
本文通过收集2020 年2 月4 日—21 日2 413 个社区发布的疫情公告,对本文所提出推估疫情TAZ 进行验证。首先将各个社区与TAZ 进行关联,确定每个社区所处的交通分析区,再判断期间出现新增确诊病例的社区是否出现在本研究推估出的交通分析区中,并计算公告存在疫情的TAZ 占本文所推估存在疫情的TAZ 比例,来表示本文所提出推估方法的准确性。
如图6 所示,统计结果表明,公告中出现确诊患者的社区都在推估存在疫情TAZ 中,并占推估TAZ 的72.7%,说明本模型能够较好推估疫情在TAZ 间的时空扩散特征。
总体推估结果的对比与验证
图7 给出了本文推估结果与官方发布结果、帝国理工大学预测结果对比。
根据本文的推算结果:
在12-31 疫情并没有大规模爆发,约40 人受到感染;
到01-23 武汉市“封城”之前,患者可能接近6 000 人;“封城”后,武汉市政府出台限制交通等措施控制疫情的爆发,但受到医疗资源的限制,大量确诊患者无法住院隔离,疫情仍在扩散,患者人数到达近25 000 人;
02-05 后,随着“雷神山”医院、“火神山”医院、“方舱”医院的投入使用,以及应收尽收政策的落实,大量未被隔离的患者被送往医院进行隔离,未被隔离的确诊患者数量开始不断下降,在3 月下旬,疫情得到基本控制,患者总人数约51 000 人左右。
现有对武汉市患者人数预测的研究非常少,帝国理工大学报告中对01-12、01-18 和02-03 三天的患者人数进行了预测,结果分别为1 723、4 000 和26 000 人,与本文所推估的结果(506、1 976 和24 242 人)相比,差距在1 200~2 000 左右,结果相当;02-18 后的结果与官方公布的患者数量已经吻合非常好,但结果仍稍高,差距约2 500 人左右(5.6%),说明前期推估存在较高的合理性。
前期由于检测试盒的严重不足,检测确诊数与本文推估数有一定的差异,属于合理的范围。
4
结语
本文基于手机数据聚合出来网格间的空间交互动态,提出了交通分析区(TAZ)尺度上的COVID-19 时空扩散推估方法,并以武汉市为例进行了实证,结果表明,本文方法能有效推估出日均的疫情新增TAZ 区,完全覆盖了所有存在疫情公告的TAZ 区,并且公告中出现确诊患者的TAZ 区占推估存在疫情TAZ 的72.7%;
累计病例数与公布结果的对比说明,2020-02-18 后的结果与官方公布的患者累计数量已经吻合非常好,差距约占5.6%,说明前期推估存在较高的合理性。
本文方法是直接利用手机数据进行交通分析区尺度上传染病传播推估的初步尝试,后续将细化空间到住宅小区级别的空间尺度,进一步提高更细粒度空间推估能力。
作者简介
冯明翔 博士,主要研究方向为大数据时空数据挖掘。
方志祥 博士,教授。武汉大学珞珈青年学者、武汉东湖高新区3551光谷创新人才。中国地理信息产业协会理论与方法专业委员会委员、中国GIS协会第一届应急工作委员会委员、中国交通地理信息系统协会会员,ACM、AAG会员,ISPRS-Working Group V/I Member-Land- based Mobile Mapping System成员。主要从事时空建模与大数据分析、时空地理信息科学、以人为本的导航理论与应用、交通地理理论与方法等研究工作。主持国家自然科学基金项目5项,参与国家自然科学基金重点项目、973计划、国家863计划、教育部科学技术研究重点项目等纵向研究课题。发布论文100余篇(其中SCI/SSCI期刊 67篇)。
引用格式
冯明翔,方志祥,路雄博,谢泽丰,熊盛武,郑猛,黄守倩.交通分析区尺度上的新型冠状病毒肺炎时空扩散推估方法:以武汉市为例[J].武汉大学学报·信息科学版,https://doi.org/10.13203/j.whugis2020014
往期精彩内容
长按下方二维码关注我们
国际影响力优秀学术期刊
EI索引源刊
中国精品科技期刊
http://ch.whu.edu.cn
whuxxb@vip.163.com
学术|权威|科普|有趣