撰文 | 十一月 责编 | 兮 乳腺癌已经成为世界上造成女性死亡的第二大疾病【1】,但如果能够在乳腺癌发生的早期进行介入和处理的话,对于病人的存活率以及预后会有极大的帮助【2】。因此,许多发达国家建立了大规模的乳腺癌筛选筛查计划。大多数的医疗机构以及政府机构都推荐所有女性在40岁至50岁之间开始乳腺癌的筛查和预防【3】。在英国和美国,每年有超过4,200万人进行乳房造影筛查(Screening mammography)。尽管乳房造影筛查技术被广泛采用,但对这些图像进行分析和解释仍然具有很大的挑战性。专家在癌症检测方面判断的准确性存在差异,即使是最好的临床医生的表现也仍有改进的余地。数据分析的假阳性结果会导致患者对于疾病的焦虑、不必要的随访和使用对身体有一定伤害的侵入性诊断手段。而在筛查中如果未能及时发现癌症的存在,则可能放任肿瘤发展到更晚期、更难以治疗的时候而延误治疗。 2020年1月2日,DeepMind公司的Jeffrey De Fauw与谷歌健康的Shravya Shetty技术研究组共同协作在Nature上发表了题为International evaluation of an AI system for breast cancer screening的文章,开发了乳腺癌造影筛查的人工智能(Artificial intelligence,AI)系统,用于对乳腺癌X射线造影数据进行大规模分析和处理。 为了建立对乳房造影筛查数据进行分析的深度学习模型,首先作者们分别选择了来自英国和美国的乳房X射线的数据集。英国的数据集包括从2012年至2015年之间英格兰的两个筛查中心25,856名女性那里收集的筛查乳房X线照片。在英国,每三年会对女性进行一次乳房造影筛查。来自美国的数据集收集的是每隔一到两年对女性进行的一次检查的数据,包括2001年至2018年间从一个学术医学中心的3,097名女性那里收集的乳房X线照片。而乳腺癌病人的数据结果的是通过后期病人是否选择进行活检以及确认病情之后的随访情况来确认的,而随访时间则是根据每个数据集在该国家的筛选间隔来进行选择。 在选取了英国和美国具有代表性的数据集之后,作者们建立了乳腺癌鉴别的AI系统。该系统用于训练识别乳房造影筛查的数据,鉴定其中存在的乳腺癌的数据。随后作者们通过三种方式对该AI系统进行了评估:1)首先对AI系统预测的数据与之前的临床验证结果进行对照;2)其次,为了评估在人群中的普遍性,AI系统的一个版本只使用了英国的数据,并使用美国数据进行重新测试;3)最后,将AI系统的性能与使用美国数据集的6名独立放射科医生的判断进行比较。最终作者们建立了能够对乳房造影筛查数据进行判断的AI系统(图1)。 图1 用于乳房造影筛查数据分析的AI系统建立及评估过程 作者们所建立的AI系统对乳房造影筛查的假阳性结果降低了5.7%(美国)和1.2%(英国),假阴性结果降低了9.4%(美国)和2.7%(英国)。而且该AI系统用英国的数据集训练后能够对美国的数据进行分析和处理,说明了该系统的广泛应用性。而且AI系统进行数据分析,既能够保持优秀的判断性能,又能够降低劳动力的使用量。 总的来说,谷歌健康与DeepMind公司建立了一个新型的AI系统,能够对乳房造影筛查的结果进行大规模分析。对该系统进行评估后,发现特异性和敏感性优于在学术医学中心执业的放射医师。该AI系统的强大评估结果为进一步的临床试验铺平了道路,以提高乳腺癌筛查的准确性和效率。 原文链接:https://doi.org/10.1038/s41586-019-1799-6
参考文献
1. Bray, F. et al. Global cancer statistics 2018: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries. CA: a cancer journal for clinicians 68, 394-424, doi:10.3322/caac.21492 (2018).2. Tabar, L. et al. Swedish two-county trial: impact of mammographic screening on breast cancer mortality during 3 decades. Radiology 260, 658-663, doi:10.1148/radiol.11110469 (2011).3. Siu, A. L. & Force, U. S. P. S. T. Screening for Breast Cancer: U.S. Preventive Services Task Force Recommendation Statement. Annals of internal medicine 164, 279-296, doi:10.7326/M15-2886 (2016).