中国学者研究 | 胃镜AI系统有效降低胃肿瘤漏检率,有效减少不必要活检
《柳叶刀-胃肠病学和肝脏病学》(The Lancet Gastroenterology & Hepatology)7月20日在线发表武汉大学人民医院于红刚教授课题组完成的一项前瞻性、单中心、随机对照、双臂平行的串联胃镜试验,共纳入了1,812名无痛胃镜检查患者,该研究评价了人工智能(AI)系统用于改善胃镜下肿瘤筛查效果。该研究表明其团队研发的AI系统(ENDOANGEL-LD 2.0)能够在不增加检查时长的前提下,有效降低胃肿瘤的漏检率,同时最大限度地减少不必要的活检。识别文中二维码或点击文末“阅读原文”,查看论文原文。
作者介绍
于红刚
博导,教授,武汉大学人民医院消化内科主任医师。
擅长消化道早癌内镜下的早期诊断和治疗,以及胆道、胰腺疾病的内镜诊疗,精于胃镜、大肠镜和小肠镜的诊疗操作。任中华医学会消化内镜学会常务委员、中华消化内镜学会大数据协作组组长、湖北省消化内镜学会候任主委、国家消化内镜专业质控中心评审专家。
视频:第一次检查(常规)漏诊,第二次检查(人工智能辅助)发现胃肿瘤
研究背景
胃癌是最常见的恶性肿瘤之一[1,2],其5年生存率低至20%,给卫生系统带来了沉重负担[3],然而早期内镜下诊治能将5年生存率提升至90%以上。[4]白光内镜(WLE)是最常用的筛查手段[5],但其灵敏度(0.48)和特异度(0.67)较低,不同机构及不同医生间的诊断水平也参差不齐,这导致早期胃癌的漏检率高达40%。[6]为了优化胃癌筛查策略,多数指南建议将放大内镜-窄带成像(ME-NBI)等技术与活检相结合来降低漏检率。[7]然而,相比WLE更高的费用和更长的培训周期限制了ME-NBI的推广,不同机构医生间的诊断精度和活检率也差别较大。[8]此外,活检率与漏检率呈负相关,一味地通过提高活检率来降低漏检率,会导致假阳性的活检量增加,病人花费和医生负担加重。21世纪以来,人工智能(AI)的发展在内镜领域展现了巨大潜力,借助AI有望同时实现低漏检率和低活检率的目标。目前验证AI系统有效性的研究主要采用回顾性的静态内镜图像,尚缺乏前瞻性的实时临床证据。因此有必要开展前瞻性的实时内镜临床试验来评估AI的有效性。
研究方法
这项前瞻性、单中心、随机对照、双臂平行的串联胃镜试验于2020/7/6-2020/12/11在武汉大学人民医院消化内镜中心进行,共纳入了1,812名无痛胃镜检查患者。本研究通过区组随机化将患者随机分配至AI优先组(n=907)或常规优先组(n=905)。随机化状态对患者和病理学家设盲(医生除外)。AI优先组患者首先接受一次完整的AI辅助白光胃镜检查,然后由同一名医生进行一次常规的白光胃镜检查;常规优先组的检查顺序相反。两次检查完成后,对AI提示或医生怀疑为肿瘤的病灶进行活检。本研究设计第2次检查的目的是为了发现第1次检查过程中漏检的肿瘤病灶,从而比较AI辅助组和常规胃镜组的漏检率。本研究中的AI系统(ENDOANGEL-LD 2.0,中文名“内镜精灵”)具有识别胃黏膜病灶和实时预测肿瘤的诊断功能,它用蓝色方框标记普通病灶,用红色方框标记疑似肿瘤的病灶。
研究结果
相较于常规胃镜检查,AI显著降低胃肿瘤的漏检率
AI优先组和常规优先组两次检查共检出肿瘤病灶数分别为49和44,在第一次检查中分别漏检了3个和12个肿瘤病灶,其漏检率分别为6.1%和27.3%,相对危险度为0.224,p=0.015。因此,内镜精灵能够显著降低胃肿瘤的漏检率。
相较于常规胃镜检查,AI有效减少不必要的活检
AI优先组和常规优先组分别纳入907和905名患者,在第一次检查中的活检患者数分别为154和325,其活检率分别为17.0%和35.9%,p<0.001。由此可见,内镜精灵能够有效减少不必要的活检。
相较于常规胃镜检查,AI有效降低胃肿瘤筛查的假阳性率
AI优先组和常规优先组第一次检查发现的疑似肿瘤病灶数分别为184和380,经活检证实的真实肿瘤病灶数分别为46和32,阳性预测值(PPV)分别为25.0%和8.4%,p<0.001。因此,内镜精灵能够有效降低胃肿瘤筛查的假阳性率。
相较于常规胃镜检查,AI并不增加检查时长
AI优先组和常规优先组第一次检查时长的中位数分别为4.0和4.0分钟,p=0.491;第二次检查时长的中位数分别为2.8和3.0分钟,p=0.091。由此可见,AI-WLE不影响检查的时长。
相较于常规胃镜检查,AI对减少胃窦-幽门区的肿瘤病灶、≤10 mm的肿瘤病灶以及低级别病灶漏检的效果更佳
AI优先组和常规优先组两次检查共发现胃窦-幽门区的肿瘤病灶数分别为23和21,漏诊数分别为3和9,漏诊率分别为13.0%和42.9%,p=0.0397。AI优先组和常规优先组两次检查共发现≤10 mm的肿瘤数分别为32和26,漏诊数分别为3和11,漏诊率分别为9.4%和42.3%,p=0.0052。AI优先组和常规优先组两次检查共发现低级别肿瘤数分别为29和28,漏诊数分别为3和12,漏诊率分别为10.3%和42.9%,p=0.0058。相对于其他部位、大小和性质的病灶,内镜精灵对降低胃窦-幽门区的肿瘤病灶、≤10 mm的肿瘤病灶以及低级别病灶漏检的效果更佳。
结论
该团队研发的AI系统(ENDOANGEL-LD 2.0,内镜精灵)能够在不增加检查时长的前提下,有效降低胃肿瘤的漏检率,同时最大限度地减少不必要的活检。目前,课题组正在启动一项覆盖全国各地区的大样本多中心研究,进一步评价该系统在提高胃肿瘤检出率乃至早癌检出率上的有效性和稳定性,探索和验证AI在消化道肿瘤早诊早治的临床价值。END
References
1 Smyth EC, Nilsson M, Grabsch HI, van Grieken NC, Lordick F. Gastric cancer. Lancet 2020; 396: 635–48.
2 Bray F, Ferlay J, Soerjomataram I, Siegel RL, Torre LA, Jemal A. Global cancer statistics 2018: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries. CA Cancer J Clin 2018; 68: 394–424.
3 Fitzmaurice C, Abate D, Abbasi N, et al. Global, regional, and national cancer incidence, mortality, years of life lost, years lived with disability, and disability-adjusted life-years for 29 cancer groups, 1990 to 2017: a systematic analysis for the Global Burden of Disease Study. JAMA Oncol 2019; 5: 1749–68.
4 Imagawa A, Okada H, Kawahara Y, et al. Endoscopic submucosal dissection for early gastric cancer: results and degrees of technical difficulty as well as success. Endoscopy 2006; 38: 987–90.
5 Zhang X, Li M, Chen S, et al. Endoscopic screening in Asian countries is associated with reduced gastric cancer mortality: a meta-analysis and systematic review. Gastroenterology 2018; 155: 347–354.
6 Zhang Q, Wang F, Chen ZY, et al. Comparison of the diagnostic efficacy of white light endoscopy and magnifying endoscopy with narrow band imaging for early gastric cancer: a meta-analysis. Gastric Cancer 2016; 19: 543–52.
7 Chiu PWY, Uedo N, Singh R, et al. An Asian consensus on standards of diagnostic upper endoscopy for neoplasia. Gut 2019; 68: 186–97.
8 Waschke KA, Coyle W. Advances and challenges in endoscopic training. Gastroenterology 2018; 154: 1985–92.
推荐阅读
点击阅读原文,查看论文原文