查看原文
其他

关于传染病防控,AI、机器学习、大数据能做些什么?

芯师爷 2022-07-03

“要警惕新型冠状病毒在医院内人传人。”中国国家卫生健康委员会高级别专家组组长、中国工程院院士钟南山呼吁道。


中国国家卫生健康委员会高级别专家组组长、中国工程院院士钟南山


当确定新型冠状病毒存在“人传人”的途径,全民似乎都意识到,事情似乎变得更严重了。


截止2020年1月22日14:37分,新型冠状病毒感染全国确诊441例,疑似病例151例……这些不断增长的数字,冲击着所有民众和研究人员的心。


01新型冠状病毒大揭秘


2020年1月21日,中国科学院上海巴斯德研究所郝沛研究员、军事医学研究院国家应急防控药物工程技术研究中心钟武研究员和中科院分子植物卓越中心合成生物学重点实验室李轩研究员合作,在SCIENCE CHINA Life Sciences上在线发表了题为“Evolution of the novel coronavirus from the ongoing Wuhan outbreak and modeling of its spike protein for risk of human transmission”的论文,揭开了新型病毒的神秘面纱。(点击文末“阅读原文”,可查看论文全文)


这篇论文分析阐述了导致武汉肺炎疫情爆发的——新型冠状病毒的进化来源,以及与导致2003年的“非典”SARS冠状病毒、“中东呼吸综合征”MERS冠状病毒的遗传进化关系。


在论文中,研究者将武汉新型冠状病毒序列与已知的SARS和MERS两种病毒序列做了全基因组对比。


发现6个新型冠状病毒序列非常相似,它们跟SARS有约70%的序列相似性,跟MERS有约40%的相似性。


这意味着,武汉新型冠状病毒更像SARS病毒,而不是MERS病毒。


序列差异性主要表现在编码S-蛋白的spike基因上,这是冠状病毒与宿主细胞作用的关键蛋白。

 

冠状病毒可分为四类:α、β、γ、δ,SARS和MERS冠状病毒均是β属冠状病毒。进一步遗传进化分析后,研究者发现新型冠状病毒也是β属冠状病毒

它在进化树的位置上与SARS病毒和类SARS(SARS-like)病毒的类群很接近,但是并不属于SARS和类SARS病毒类群。

有意思的是,新型冠状病毒和SARS/类SARS冠状病毒在进化上有共同的外类群——一种寄生于果蝠的HKU9-1冠状病毒

所以可以推断,新型冠状病毒的自然宿主也可能是蝙蝠

新型冠状病毒会通过哪种途径感染人?研究者对新型冠状病毒感染人的机制和通路进行了分析。

研究者首先比较了三种病毒S-蛋白的RBD区序列,发现在RBD区域中,新型冠状病毒与SARS病毒比较相似,但与MERS病毒差异很大,所以排除了S-蛋白与DPP4相互作用结合感染人的可能。

 
文章作者利用分子结构模拟的计算方法,对武汉冠状病毒S-蛋白和人ACE2蛋白进行了结构对接研究,结果令人惊讶:虽然武汉冠状病毒S-蛋白中5个关键氨基酸有4个发生了变化,但变化后的氨基酸,却整体性上非常完美的维持了SARS病毒S-蛋白与ACE2蛋白相互作用的原来的结构构象,与人ACE2蛋白的亲和力还是很强。
这一结果说明武汉冠状病毒是通过S-蛋白与人ACE2互作的分子机制,来感染人的呼吸道上皮细胞。

该研究成果为科学防控新型冠状病毒,制定防控策略和开发检测/干预技术手段奠定了科学理论基础。

02AI在传染病防护中的价值


我们知道,类似于新型冠状病毒这种传播性极强的病毒,预防、监测和快速反应可以大大延缓疫情的爆发

随着人工智能和机器学习成为全球医疗系统越来越重要的组成部分,一种新的战略正在与传染病作斗争。越来越多的科学家正在开发使用人工智能(AI)来预测传染病蔓延的方法。

事实上,人工智能早已在流行病防控系统中发挥着不可替代的作用。

2014年,西非爆发埃博拉疫情。相关专家用7个月建立了一套智能预测模型。该模型引入了多项影响疾病传播的变量数据,包括病例数量、感染率、交通数据、移动通信数据、社交媒体数据……根据模型预估,如果不加以控制,最终感染人数将达到140万人。

为了将感染人数将至最低,医务人员在数据的指引下,奔赴核心疫区进行干预,最终将感染人数控制在了2.8万人以内,有效阻止了疫情的扩大。至此,AI在流行病防控战场上一战成名。

 
武汉新型冠状病毒疫情地图(图片来源:丁香园)

我们知道,大多数传染病都通过人与人的“接触”传播。在计算传染病学中,人与人之间的接触被定义为“相同物理环境中不同个体间的交互行为”。


人与人的接触行为构成传播病毒的“接触网络”,网络结点表示个体,网络链接表示接触关系。接触网络的结构显著影响着病毒扩散的时空模式。


以通过飞沫扩散的呼吸道传染病为例,个体间面对面的谈话、握手,以及人群的聚集、乘坐交通工具等行为都会引起病毒的扩散,增加感染者传染易感者的几率。追踪人的接触行为,还原出“隐形”的病毒传播通道,不仅可以快速定位和隔离接触过感染者的高风险个体,还可以帮助人们定量分析传染病传播的途径、过程和趋势,制定相应的疫情控制策略。


接触追踪面临的最大困难在于,直接描述接触行为的数据难以获取。由于个体间的接触行为常常是琐碎、多样,不易被直接观测和记录,因此很难收集到足够多、高质量的接触数据,供接触追踪使用。


在疾病传播过程中,我们能观测到的是疾病传播所产生的影响,而非个体间的直接相互作用。如在 H7N9 禽流感爆发过程中,我们很难确定一名患者在出行途中通过接触传染了哪些个体,而仅能观测到不同时间和空间内新增的 H7N9病例数和死亡人数。  


流行病学和计算机科学的学者对如何准确捕获个体接触行为数据、如何从其他数据源间接推断出接触网络做了很多探索,提出了多种方法。这些方法大都广泛采用了与 AI 相关的技术,如智能感知、网络分析、数据可视化、机器学习、多源异构数据挖掘、数据驱动的逆向工程和多智能体模拟等。


03机器学习、大数据在传染病防护中的应用

此前,在美国《科学》杂志上,英国格拉斯哥大学研究团队发布一项人工智能新研究报告:科学家借助全新的机器学习算法,可以更高效地从基因层面预测埃博拉和寨卡等病毒的天然宿主,从而采取措施预防这些病毒传播到人类身上。

为了缩短寻找病毒天然宿主的时间,该团队研究了一种机器学习算法,通过分析超过500种病毒的基因组信息来训练这个算法,从而让算法学会将病毒基因组中的特征与它们的动物源头一一匹配,进一步预测出哪种病毒来自哪个动物宿主,实验中其准确率表现的令人满意。

该研究的作者之一、格拉斯哥大学科学家达尼艾尔·斯特赖克尔认为,如果机器算法能够做到利用基因组信息来预测病毒的天然生态,就可帮助相关人员在最快的时间内确定病毒的动物宿主,这也意味着,我们可以更早地进行干预,预防病毒传播给人类。

此外,在判断某人是否是传染病易感人群时,对每个医生来说,技术的把握是不确定的,有医生认为他是易感人,有医生判断他不一定是易感人。这种情况下,可引用AI技术。AI技术会调出他在所有医疗机构看病的档案,并一定可以做出精确的判断。这样使判断同质化,因此传染源就被控制在一个很小的范围内,实现精准的预防。

可以看到,如果正确运用机器学习与大数据技术,将有效的监测、预防疾病的现状,延缓传染病的爆发时间。

那么,机器学习、大数据对于现在武汉新型冠状病毒防护有没有效呢?

对于目前在中国出现的新病毒,主要挑战在于还没有经过验证的模型,可以告诉我们预测是否有意义。格拉斯哥大学生命科学研究员Daniel Streicker博士表示。

04如何正确预防冠状病毒?
 

近日,湖北省卫生计生宣传中心也发布了最新长图,教您正确认识并预防冠状病毒。



本文图片来源于科技日报、AI报道等,仅供交流学习之用。如有任何疑问,敬请与我们联系info@gsi24.com。


▼ 往期精彩回顾 ▼数风流人物,还看今朝——2019年半导体风云人物盘点
武汉新型冠状病毒,真实情况到底如何?
又一条“护城河”!华为旗下哈勃科技投资第七家公司
半导体行业2019年爆款好文全收录!收藏这一篇就够了
光器件厂商多而不强,国产光芯片之路该怎么走?
2019年全球半导体销量下滑,这些芯片却逆势缺货?
年终盘点 | 2019年国产IC企业的十大收购案件


 推荐关注:今 日 芯 闻 

微信号:todaysemi

百万半导体人睡前必读


爱我请给我好看!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存