作者采访 | 深度学习算法应用于COVID-19影像学诊断
《柳叶刀-数字医疗》(The Lancet Digital Health)近日发表来自华中科技大学同济医学院附属同济医院王伟教授团队领衔的论文, 研究旨在开发一种基于胸部CT的深度学习算法,用于发热门诊的快速分流。《柳叶刀-数字医疗》(The Lancet Digital Health)主编Dr. Rupa Sarkar对王伟教授进行了采访,解读本研究深度学习算法的原理,研究结果以及探讨人工智能模型如何帮助COVID-19患者。
作者介绍
王伟
教授,博士生导师
华中科技大学常务副校长,国家重大公共卫生事件医学中心主任。中华医学会神经病学分会常委,中华医师学会神经病学分会副会长。主要研究方向为神经系统重大疾病发病机制以及治疗干预策略。
作者采访
1
Rupa Sarkar:请您简单介绍一下本篇论文的研究内容和相关的研究背景。
王伟教授:COVID-19暴发初期,尤其在疫区,大量患者涌入发热门诊,极大增加了一线医务人员的接诊压力。RT-PCR由于早期的资源紧缺,无法完全满足临床需求,胸部CT成为筛查新冠疑似患者的重要工具[1,2,3,4],但也给影像科医师带来了巨大的压力。除了发热门诊,大量新冠确诊患者在住院期间需要定期进行CT检查以确认病程发展,精准的影像学评估对医师提出了更高的要求。
华中科技大学同济医学院附属同济医院(同济医院)在此次疫情中身处抗疫一线,强烈感受到了COVID-19暴发给医疗资源带来的压力。从临床实际需求出发,同济医院联合北京推想科技有限公司、武汉科技大学附属天佑医院(天佑医院)、咸宁市中心医院、中南大学湘雅二医院(湘雅二院)和深圳市第三人民医院(深圳三院),共同开展将深度学习算法应用于COVID-19影像学诊断的跨学科多中心研究。基于大量RT-PCR确诊新冠患者的胸部CT影像,我们训练得到了一个可用于分诊疑似新冠患者与自动分析确诊患者影像学表现的深度学习算法(figure 1)。通过在不同新冠发病率地区的临床中心数据集上的充分验证,本研究证明深度学习可有效提升发热门诊的病人流转效率,辅助医师精准分析确诊患者的病情进展。
2
Rupa Sarkar:请您介绍一下研究中使用深度学习算法的基本原理
王伟教授:考虑到本文旨在同时实现疑似新冠患者分诊和确诊患者病程分析两个研究目标,我们采用了以体素分类为基础、病灶分割为媒介、患者分类为目的的U-Net深度学习算法。U-Net是比较经典的深度学习分割算法,其关键设计在于编码器与解码器路径之间的连接路径可以在模型的解码过程中融合低级特征与高级特征,来实现更准确的体素分类与定位。COVID-19患者的胸部CT影像表现主要双肺多发斑片状磨玻璃影、实变影等,随病情发展病灶的体积和形态亦会发生变化。本研究选择使用U-Net作为基础网络结构也是希望验证一个相对简单、通用的深度学习模型是否可以快速的在新疾病上产出实际临床应用价值。
3
Rupa Sarkar:您能为我们详细解释一下研究结果及新的发现是什么吗?
王伟教授:研究团队首先收集了2447例胸部CT影像用于算法训练,以及639例胸部CT影像用于算法内部验证。在内部验证集上算法的AUC,灵敏度和特异度分别达到0.985,0.923,和0.851。(figure 2)
为验证该算法在发热门诊患者分诊场景上的应用效能,研究团队分别从天佑医院(较高新冠发病率),咸宁市中心医院(中等新冠发病率)和湘雅二院(较低新冠发病率)连续收集两周发热门诊患者的胸部CT影像作为外部验证集。以患者CT影像报告为参考标准,算法的AUC,灵敏度,特异度,PPV和NPV分别为0.953,0.923,0.851,0.790,和0.948。其中,在高发病率地区的患者人群上,算法表现出了相对更高的灵敏度和特异度。通过模拟将AI算法用于提示影像报告审核医师和发热门诊临床医师的分诊模式,我们对AI辅助下的分诊效率进行了估算。结果显示在两种模式下AI均可辅助发热门诊更快识别出疑似新冠患者。
除了在分诊场景中的应用,本文还探究了算法基于CT影像评估患者病情进展的准确性,以三位影像科医师的评估结果作为参考标准,算法识别有进展患者的的灵敏度和特异度分别为0.962和0.875。
4
Rupa Sarkar:人工智能模型如何帮助COVID-19患者?
王伟教授:本研究证明,深度学习算法能够在发热门诊场景下高效标记疑似病例并提示医师,减少传统临床流程中疑似患者的诊断等待时间,促进疑似病例的及时干预同时减小院内交叉感染风险。此外,本研究中的算法能够准确分割肺炎病灶区域并进行自动定量分析,可减轻放射科医师肉眼评估细微病灶变化的负担,辅助医生实现新冠确诊患者自动、高效的病程监控和管理。
5
Rupa Sarkar:本研究未解决的问题和未来的重点是什么?
王伟教授:本研究尚未解决的一个主要问题是诊断试验中的“不完美金标”问题。在研究中,我们分别以患者影像学报告和RT-PCR结果作为参考标准分析了AI的分诊准确性。由于影像诊断本身特异度不高,而RT-PCR检查因为采样和病毒载量等问题又存在灵敏度不高的问题,此外,RT-PCR不可避免地存在证实性偏倚(verification bias)的客观情况,像很多过往的新冠诊断试验一样本文中的参考标准并不是真正意义上的“完美金标”。今后的研究可以结合统计学中不完美金标的处理方式来更准确地评价算法性能。
作为将深度学习应用于新冠诊疗的初步概念验证(proof of concept),本文采用了经典的U-Net算法来实现病灶的自动分割与患者分诊。经典U-Net建模依赖监督学习,训练需要大量人工标注,在疾病暴发初期医疗资源紧缺的情况下实现成本较高,未来可尝试采用弱监督和半监督等方法来减少医师的工作投入。
本研究收集了多个真实世界的临床数据集以模拟并评估算法嵌入临床工作流后的诊断效能,未来仍需要开展前瞻性临床试验来进一步验证实际临床场景下人机结合的效率和准确率。END
题图 Copyright © matejmo/Getty Images
参考文献
1 Kanne JP Little BP Chung JH Elicker BM Ketai LH Essentials for radiologists on COVID-19: an update—radiology scientific expert panel. Radiology. 2020; 296: e113-e114
2 Shi H Han X Jiang N et al. Radiological findings from 81 patients with COVID-19 pneumonia in Wuhan, China: a descriptive study. Lancet Infect Dis. 2020; 20: 425-434
3 Ai T Yang Z Hou H et al. Correlation of chest CT and RT-PCR testing in Coronavirus Disease 2019 (COVID-19) in China: a report of 1014 cases. Radiology. 2020; 296: e32-e40
4 Zu ZY Jiang MD Xu PP et al. Coronavirus Disease 2019 (COVID-19): a perspective from China. Radiology. 2020; 296: e15-e25
推荐阅读
点击阅读原文,查看柳叶刀 COVID-19 资源中心更多论文