中共中央总书记、国家主席、中央军委主席、中央全面深化改革委员会主任习近平2月14日下午主持召开中央全面深化改革委员会第十二次会议并发表重要讲话指出,要鼓励运用大数据、人工智能、云计算等数字技术,在疫情监测分析、病毒溯源、防控救治、资源调配等方面更好发挥支撑作用。
陈金雄主任针对新冠肺炎(NCP)诊断依据调整引起的确诊病例数据的变化,结合大数据技术流派进行深入解读,深刻揭示在此次疫情防控和防治中,大数据和AI到底如何发挥作用。
HIT专家网从1月24日除夕之日即启动和持续开展“抗击疫情”系列报道,在HIT业界产生强烈反响。我们从中感受到卫生信息人的坚韧与实干,感受到医疗信息化行业众志成城的磅礴力量!(投稿邮箱:zhu_xiaobing@HIT180.com)
这段时间,我想大多数国人每天早上睁开眼睛,第一件事就是打开手机,第一时间了解疫情的情况。尽管大家心理上可能都有预感,但2月13日发布的数据还是令人震惊。
2月12日0时-24时,湖北省新增新型冠状病毒感染的肺炎(NCP)病例14840例。这14840例新增病例中,有13332例是临床诊断病例,占了绝大多数。那么,到底什么NCP的临床诊断病例,这背后又蕴含着什么样的原理,本文就从大数据角度进行分析。
目前NCP确诊的两种方式
目前NCP确诊主要有两种方式:
一是核酸检测病例。在此之前,核酸检测是NCP确诊的“金标准”,核酸检测为阳性的就是确诊病例。如果核酸检测为阴性,即使其它各种特征包括影像学检查非常明显,也只能作为疑似病例,无法作为确诊病例。
但核酸检测存在一定的问题,主要是试剂短缺、存在假阴性、有检测资质的机构较少以及实验室条件要求高等,都在影响新冠肺炎病人的确诊。潜在感染者的防控措施如果不能及时到位,就无法从根本上切断传染源。
二是临床诊断病例。临床诊断病例=疑似病例+影像学检查,不再需要核酸检测。
针对核酸检测存在的那些问题,临床一线专家呼吁,用影像学诊断取代核酸检测,成为NCP确诊的依据。据传最早提出这一主张的是武汉中南医院一线影像医生张笑春。她通过自己的微信朋友圈呼吁:别再迷信核酸检测了,强烈推荐CT影像作为2019-nCoV (新型冠状病毒) 肺炎的主要依据。
1月30日,中国研究型医院学会感染与炎症放射学专委会和中国医师协会放射学分会感染影像专委会等单位联合发布了《新型冠状病毒肺炎影像学诊断指南(2020 第一版)》,该指南由法定传染病医学影像学专家、高博医疗集团顾问专家李宏军教授领衔的专家团队负责制定。
针对湖北防疫的实际情况以及专家的意见,《新型冠状病毒感染的肺炎诊疗方案(试行第五版)》在湖北省的病例诊断分类中增加了“临床诊断”,以便患者能及早按照确诊病例接受规范治疗,进一步提高救治成功率。湖北以外的其他省市自治区依然采用核酸检测作为NCP确诊的唯一依据。2月12日,湖北省终于全面将临床诊断作为NCP确诊的依据之一。
人工智能的两大技术流派
NCP这两种诊断方式让我想起了人工智能的两大主要技术流派。
一是知识驱动方法。也称演绎推理方法,专家制定规则,小数据大智能。这种方法是基于因果关系,由从“前提”的已知事实,“必然地”得出结论的推理。采用符号逻辑的办法来表达知识,实现推理技术的工程化成为其主要技术内容。语义技术(Semantic Technology)与知识图谱(Knowledge Graph)可以被看作广义的演绎推理的工程化技术。
二是数据驱动方法。也称归纳推理方法,机器学习规则,大数据小智能。这种方法是基于大数据的普遍化或归纳普遍化,是从关于样本的前提到关于总体的结论的过程。机器学习(Machine Learning)可以被看作广义的归纳推理的工程化技术,包括基于神经网络模型的深度学习(Deep Learning)技术[1]。
逻辑推理能力是人类特有的本领,给出原因,我们能够通过逻辑推理得到结果。在过去,我们一直非常强调因果关系,一方面是因为我们常常是先有原因,再有结果,另一方面是因为如果我们找不出原因,常常会觉得结果不是非常可信。而大数据时代,大数据思维要求我们从探求因果联系到探索强相关关系[2]。
对照NCP的两种确诊方式与人工智能的两种技术方法,显然核酸检测属于演绎推理的知识驱动方法,临床诊断属于归纳推理的数据驱动方法。
在有确切的因果关系的情况下,肯定要优先考虑采用演绎推理的方法,由核酸检测阳性这个“因”得出NCP病例这个“果”。但当因果关系在短期内还不完全成立的情况下,大数据方法无疑是可替代的一种方式。这也是为什么此次NCP确诊方式接受临床诊断方法的主要原因,但只限于疫情严重的湖北省,湖北以外的省市自治区依然把核酸检测作为NCP确诊的唯一依据。
当然大数据作为确诊依据是有条件的,大数据通常要具备5V特征,即大量化(Volume)、多样化(Variety)、快速化(Velocity)、价值度(Value)和准确性(Veracity)。吴军在《智能时代》一书中进一步阐述大数据要具备数据量大、多维度、全面性等要素,数据的维度和全面性有时比数据量大还重要,只有具备足够维度和更加全面的数据,大数据才能更好发挥作用。
疫情防控,大数据和AI如何发挥作用
那么,在此次疫情防控和防治中,大数据和AI到底如何发挥作用?我认为可以重点从以下几个方面去考虑。
一是在临床诊断方面。由于影像学诊断在NCP确诊方面起主导作用,而影像AI又是医学AI中发展最成熟的领域,因此影像AI无疑是最能发挥作用的。
在此次疫情防治过程中,不少企业和医疗机构适时推出影像AI解决方案,发挥了不小的作用。据报道,武汉同济医院、武汉协和医院中南医院等疫区一线医院与企业进行合作,上线NCP影像辅助诊断产品,帮助医生在没有分子诊断的条件下进行决策,给出建议,并通过疫区的高度疑似新冠肺炎患者的典型数据来训练和优化模型,不仅敏感性非常高,特异性可以达到80%-90%。
1月28日,上海市公共卫生临床中心上线新型冠状病毒性肺炎智能影像评价系统。该系统采用创新的人工智能全肺定量分析技术为临床专家提供基于CT影像的智能化新型冠状病毒性病灶定量分析及疗效评价等服务,更为高效、准确地为临床医生提供决策依据,助力疫情防控。
如果有足够高质量的影像数据训练的话,AI可以更大程度配合影像专家,承担大部分影像诊断工作,无疑可以极大提高效率和防治能力。
二是在临床分型方面。NCP诊疗方案(试行第五版)根据是否有临床症状、是否有肺炎、肺炎的严重程度、是否出现呼吸衰竭、休克、有无其他器官功能衰竭等分为轻型、普通型、重型和危重型,不同类型的病例处理方式是不一样的。
据中国科学院院士、解放军总医院第五医学中心感染病诊疗与研究中心主任、国家感染性疾病临床医学研究中心主任王福生教授介绍,新型冠状病毒肺炎是一种急性自限性的疾病,也就是有的轻症病人,肺部病变不严重,免疫力又比较好,通过自身抗病毒的能力,很快可以把病毒控制,不经过治疗可以自己好。当然其他重症病例通过治疗才能恢复,也就是 “自愈”加上“治愈”。
如果能够通过大数据把病例进行临床分型,把找到轻型自限性的病例,这部分病例完全可以单独隔离观察和必要的简单治疗,可以极大提高医疗资源的利用率。
三是在基因检测方面。大数据和AI算法可以有效提升基因检测效率,浙江省疾控中心上线自动化的全基因组检测分析平台,利用阿里达摩院研发的AI算法,可将原来数小时的疑似病例基因分析缩短至半小时,大幅缩短确诊时间,并能精准检测出病毒的变异情况。百度大脑将病毒全基因系列组结构预测从55分缩短至27秒。
四是在病毒追溯方面。1月24日,北京大学工学院教授朱怀球团队在bioRxiv预印版平台发表《深度学习算法预测新型冠状病毒的宿主和感染性》一文。在对2019新型冠状病毒的宿主研究和预测中,通过构建VHP(病毒宿主预测)算法模型,将已经提取的新型冠状病毒的基因组,与已有病毒基因数据库做数据检索和对比,实现新型冠状病毒自然宿主的寻找和预测。通过对VHP模型计算的结果分析,筛选的病毒宿主包括犬、猪、貂、龟和猫。研究人员经过分析比较后认为水貂的病毒的传染性模式更接近新型冠状病毒。
五是在疫情防控方面。AI算法在精准防疫以及帮助缩短病例确诊时间可以发挥重要作用。防控疫情,需要更精准全面地掌控疫情信息,疫情排查上报数据管理平台,助力精准施策有效管控。
浙江省依托大数据优势,利用“大数据+网格化”的方法研判疫情,利用大数据分析出人群聚集热点分布、人群跨区域流动等信息,提前预测疫情发展趋势,指导医疗资源的合理调度。同时,通过数据回溯分析,相关部门可以尽早发现疑似病患、密切接触者,有助于及时隔离、切断传染源。
另据报道,在宁波,通过对公共视频比对,找到了一位肺炎确诊患者的患病过程:该患者在双东坊菜场买菜时与另一位确诊肺炎的路人在同一摊位有过短暂(约15秒)的近距离共同驻留,且两人均未佩戴口罩。目前,已追踪到患者5密切接触者共19人,均已实施集中隔离医学观察。而这15秒就成了AI识别的最关键15秒。
上面介绍了大数据在疫情防治方面的一些微观应用,宏观上,大数据可以发挥更大的作用,比如在应急指挥调度和资源统一调配等。
为了做好疫情防治的大数据应用,建议各医疗机构、各企业通力合作,加强数据共享和科研协作。各级地方卫生行政管理加强领导和引导,做好医疗数据的组织和管理,在确保数据安全的前提下开放给相关企业进行研究和开发,以最快的速度支撑疫情的防治。
国家卫生健康委在2月4日发布《国家卫生健康委办公厅关于加强信息化支撑新型冠状病毒感染的肺炎疫情防控工作的通知》,提出要充分发挥信息化在辅助疫情研判、创新诊疗模式、提升服务效率等方面的支撑作用,希望这些政策能够得到充分的执行。
参考文献:
【1】 黄智生,“医学知识图谱”报告
【2】吴军,《智能时代》
【作者简介】
陈金雄,医疗信息化长期耕耘者、探索者与布道者,《迈向智能医疗》、《互联网+医疗健康》与《互联网+基因空间》主编,电子工业出版社《互联网+医疗健康》丛书主编。
兼任中国医药信息学会电子病历与电子健康专业委员会主任委员、中国研究型医院学会医疗信息化分会副会长、中国医学装备协会数字医疗技术分会副会长、中国医院协会信息管理专业委员会常委等职。
先后被《计算机世界》评为推动中国信息化突出贡献奖,被中国信息化推进联盟评为中国信息化年度优秀人物和《IT经理世界》评为中国优秀CIO ,被中国IT价值联盟评为全国最有价值CIO。2009年被美国《信息周刊》评为全球50个优秀CIO。
HIT专家网∣致力推进中国卫生信息化
想加入HIT专家网专业交流群吗?
请添加“HIT专家网”小助手微信好友
(请务必注明姓名、单位名称、职务、主管技术或产品领域等实名信息)
微信订阅号:HIT180com
微信服务号:chinaHIT
投稿:tan_xiao@hit180.com
商务合作:(010)82373062