【学术讲堂回顾】“学术互助讲堂”第14期:基于疫情树林的传染病时空分析
无论是风里,还是在雨里,我都在这里守候着你~
2018年10月13日20:00,学术无界第14期学术互助大讲堂在bilibili直播平台如期举行,此次邀请到的是中山大学地理科学与规划学院的博士生李美芳,讲座主题为“基于疫情树林的传染病时空分析”。本次讲座由学术无界主办,模型研究中的小伙伴承办,武汉大学国重GeoScience Café、图灵理工学院、自然科学交流平台、学术无界旅游研究分会、学术无界空间计量分会协办。
李美芳
主讲人简介
李美芳,中山大学地理科学与规划学院在读博士,在中山大学及国家留学基金委资助下, 2016年12月至今在美国达特茅斯学院进行为期2年的联合培养,国内导师黎夏教授,国外导师施迅教授。研究方向为传染病的时空建模,以登革热为例,提出了通过病例时空信息构建疫情树林(Epidemic Forest)来刻画传染病传染和传播关系的理论框架(该研究已被AAG Annals接收)。共参与国内外项目3项,参与的发表出版物6篇,其中第一作者3篇,曾获2018美国地理学会年会健康地理专业组学生论文竞赛一等奖,2015国家人口健康杯学生论文竞赛一等奖等。
主讲
内容
图1 传染病时空模型
李博士分享了自己在国内外导师的指导下,近期主要做的研究工作。在这项研究中,她利用个体水平的登革热病例数据来构建疫情树林,从而对传染病的传播过程进行时空分析和制图。报告主要分为三个部分,即研究背景和研究工作、疫情树林模型的理论框架、并以2013年广州市登革热疫情为例的案例分析。
图2 病例可再生数Rt的定义
在传染病动力学的研究中,病例可再生数Rt是使用最为广泛的用于刻画传染病传播过程的度量。其定义是在t时段的病例所产生的平均感染者数,这里t时段的病例就是分母Pt他们产生的子代总数就是分子Cpt。Rt>1表明传染者增加,需要加强防控; Rt <1表明被传染者减少,疫情减弱。Rt的计算通常是基于仓室模型,用病例数据拟合一系列的微分方程求解,最后简单地用一个均值表示整个研究区的情况,忽略了疫情的空间分异。
图3 疫情树示意图
图4 疫情树林示意图
图3为前人提出的疫情树,树上的每个节点代表一个病例,每一条边代表直接的传染关系,整棵树代表了由一个初始病例引发的传染爆发过程。在前人研究的基础上,李博士提出了疫情树林的概念模型(图4),即由多个初始病例引发的传染传播过程,并搭建了一个囊括疫情树林的构建、信息挖掘、信息利用三个方面的较为全面和系统的研究框架。这个研究实现了对Rt的空间化,加深了对传染病制图的认识。李博士从如何构建疫情树林、从构建的疫情树林中提取哪些信息以及如何利用这些信息三个方面对疫情树林的研究框架进行了详细阐述。
图5 疫情树林构建过程
构建疫情树林的过程,实质就是为每一个子代病例寻找亲代病例,可将其分为三个步骤:根据子代病例的发病时间和地点,识别潜在的亲代病例→评估子代病例与每个潜在亲代病例之间关系的强度→确定子代病例的亲代病例。整个建树过程可以分为确定性(Deterministic)和随机(Stochastic)两大类。
在建好的疫情树林上,可以提取三方面信息,即结构信息、时空信息和流行病学信息。在结构信息中,采用图论中的指标对节点级别和树级别的结构特征进行量化。节点级别包括深度和度两个指标,前者指示了该节点在传播过程中所处的位置,后者反映了该病例的传染能力。树级别指标包括总共的节点数、高度、树上所有节点度的统计(如平均度数、最大度数、最小度数、以及度的标准差)。前两个指标反映了初始病例的传染能力,后一个指标用来量化树上节点的整体质量和离散程度。在时空信息中,时间方面,包含每棵疫情树的起始时间和结束时间。空间方面,包含每棵疫情树的地理空间范围和传播方向信息。在流行病学信息中,计算了树林级、树级和每个地点级三个不同尺度上的Rt值。其中每个地点级的Rt也就是对Rt做出了高分辨率的栅格地图,即实现了对Rt的空间化。
对于从疫情树林中提取到的信息,还可以进一步的分析:如分析和可视化疫情的特点,探测疾病与环境之间的关系,以及模拟不同人为干预措施的实施效果等。
图6 研究区广州市
图7 不同参数设置下确定性方法的实验结果
以2013年广州市登革热疫情为例,病例数据来自广东省疾控中心,在建树过程中,考虑了时间权重、病人的潜伏期、病人的扩展传染期3个参数,前期采用了确定性建模方法,对每个参数分别设置了3个值,构建了相应的疫情树林,并对建好的疫情树林分析其结构信息、时空信息以及流行病学信息,最后对提取的流行病学信息,即不同尺度的Rt,分析其与气候要素之间关系。
图8 讨论
图9 结论
这项研究第一次提出了疫情树林模型的概念框架,并将这一方法进行了实例应用。研究发现,每次流行病爆发过程中,都可能存在一个超级传播者,所以如果能够及早发现这个超级传播者,将可能尽早有效地控制疫情传播;第二,不同的参数设置会导致不同的建树结果,需要对参数的设置进行更多研究,也体现了随机性方法的必要性;第三,三个尺度上的Rt值表达了不同的信息,说明空间化的重要性与必要性;最后,每个地点上的Rt,其实是传染病的疾病制图。通过这个研究,李博士探索和证明了如何将流行病学模型空间化,空间化后能够提取哪些信息,以及如何利用这些提取的信息。
李博士的讲解详细,内容实用,适合广大学术爱好者深入学习,并于讲座结束后公布了讲座PPT及个人联系方式,希望通过此次讲座分享的研究成果和发现,能够促进同行之间的相互交流,得到更多的意见和指导。此外,疫情树林这一模型已集成在ArcHealth软件,大家如果有兴趣,可以直接与李博士联系。
福利
关注学术无界,回复:大讲堂,
即可获取本期讲座视频链接。
“学术科研互助大讲堂”简介
学术无界大讲堂由团队全体成员协力搭建,旨在为广大科研工作者提供一个自主运行、畅意交流的科研学习平台,奉行“干货至上,听有所获”的实用性原则。为了充分发挥平台作用,“学术无界大讲堂”每月定期邀请学术界知名学者、研究人员和优秀博士生在线分享自己擅长研究领域的相关理论、软件实操和学习经验。
目前学术无界大讲堂惠及数万科研人员,已成功举办十四期,讲座内容坚持以科学理论与模型方法并重,内容主要涉及文献检索和下载技巧、平滑转换模型、遥感信息分析、空间统计/计量分析、生态敏感性评价等方面。获得了大家的一致好评,欢迎大家继续关注学术无界大讲堂!
资源仅供学术交流使用,严禁商用!
如有侵权,请微信联系小编:mary836421880
推文期数:2018128
素材提供:温雪颖 刘静 莫日根 袁慧洁
马庆涛 蒲生亮 崔屹峰
责任编辑:马丽 刘炳杰 杨玉婷 胡青江
推文审核:张天舒 梁龙武 骆丹云
总审核:学术无界顾问团
下期预告:就业招聘|硕博招聘信息九
往期回顾:
【学术讲座回顾】“学术无界讲堂”第13期:遥感数据下载与处理