喜报 | 科大讯飞刷新LUNA医学影像国际权威评测世界记录!
近日,科大讯飞人工智能研究再获突破:在国际医学影像领域的权威评测LUNA上获得平均召回率92.3%的检测效果,以显著优势获得该项评测的第一名并刷新世界记录。继在智能语音、语义理解、机器翻译等领域取得世界第一之后,科大讯飞在计算机视觉与医学影像相结合的重要领域亦走到了世界前列。
”| 本文共1775字,阅读时长约3分钟。
LUNA评测官网最新成绩公布,科大讯飞获得第一并刷新世界纪录
LUNA (LUng Nodule Analysis) 评测是肺结节检测领域最权威的国际评测,也是医学影像领域最具代表性、最受关注的评测任务之一。其采用的数据来自美国多家医疗机构,并且由多名专家医生共同标注完成。该评测从2016年开始,吸引了大批国内外学术界和产业界团队的参与,包括香港中文大学、北京大学、浙江大学、奈梅亨大学、阿里巴巴、Mevis以及诸多新兴创业公司。
新领域刷新世界记录
作为中国智能语音和人工智能的领导者,围绕着讯飞超脑,科大讯飞在感知智能及认知智能领域不断取得新的成就和突破。不仅在智能语音领域,在手写图文、人脸识别等计算机视觉领域,科大讯飞也已深耕多年。
医学影像识别相对于传统的自然场景等图像识别任务难度更大、要求更高。以LUNA评测中的肺结节检测任务为例,其特点是输入信息量“大”、待检测目标“小”:例如一例1.25mm层厚的CT一般包含200多张影像,每张影像大小一般为512x512像素,而小的肺结节直径仅有4个像素。
肺结节样例,其在肺部占比很小
针对医学影像识别任务的特殊问题,科大讯飞医学影像团队在主流图像识别和检测框架的基础上,专门设计了一系列方案,使得目前国际流行的深度学习框架可以完美的迁移应用于医学影像识别相关任务中。
具体来说,为了提升医学影像辅助诊断系统中最主要的指标——召回率(召回率低意味着系统会漏掉患者的关键病灶信息,对患者的健康造成很大隐患),讯飞采用了多尺度、多模型集成学习的方法来显著提升召回率,同时针对该方案引起的负面影响——虚警的增多和重复检测问题,我们还创新性的使用结节分割和特征图融合的策略来进行改善。
此外,医学影像识别任务的另一个难点在于标注错误很难完全避免,即使是LUNA评测所采用的精标数据集,也存在漏标注等现象,数据标注错误会直接影像识别的性能。为了降低标注错误带来的影响,讯飞还提出一种有效样本挖掘策略,该策略能够通过在线学习过程自动过滤可疑错误样本,大大提高系统的检出效果。
最后,一个好的医学影像辅助诊断系统除了需要具备高准确性以外,还需追求高效率。在LUNA评测中,为了既准确又快速的检出结节,讯飞利用fully 3D-CNN模型来计算特征图,并在特征图上进行检测。此外,借助预训练可以利用精简模型达到与复杂模型相当的性能,大大提高了检测效率。目前科大讯飞医学影像辅助诊断系统处理完一例薄层CT只需要1-2秒钟,比已公布的同类型系统处理时间下降了一个数量级。
LUNA评测中的科大讯飞系统性能曲线
AI+医疗 应用为王
科大讯飞自2016年开始重磅发力医疗领域,至今已在智能语音电子病历、影像辅助诊断、导医导诊机器人、移动端APP等多场景落实应用。2016年6月,科大讯飞与安徽省立医院共建医学人工智能联合实验室;今年4月,科大讯飞又与中国医学科学院北京协和医学院签订战略合作协议,宣布共建医学人工智能研究中心。此外,科大讯飞还与清华大学共建人工智能实验室,与诸多一流医院、医学机构的合作,能够更好地整合核心技术、行业专家和行业大数据,从而真正打磨出具有临床实用价值的智慧医疗产品。
相对于LUNA评测,在医院等实际应用场景中的影像数据质量参差不齐,识别及诊断难度也更大。本次参评讯飞将目前已在多家医院中实际应用的系统方案直接迁移至LUNA评测数据上进行验证,获得第一名也充分说明了在数据可比的情况下讯飞算法的优越性。
科大讯飞医学影像辅助诊断系统
我们认为,能否对医生产生实际的辅助价值才是衡量医学影像辅助诊断系统优越与否的最重要指标。科大讯飞的医学影像辅助诊断系统的主要功能是帮助影像医生阅片,勾画病灶,指出病变区域,并对结节的良恶性进行智能诊断;通过产品应用,不仅能够让优秀的三甲医院医生能够提高工作效率,也让基层医院医生能够得到来自专家医生的意见指导,提高诊疗水平,从而惠及患者、惠及民生。
科大讯飞一直秉承“顶天立地”的理念,持续进行源头技术创新和产品应用研发。未来科大讯飞将深度致力于基于感知和认知智能技术的人工智能辅助诊疗研究,用先进的人工智能技术助力国家“健康中国”战略!
点击阅读原文,即可查看LUNA评测结果页面
拓展阅读
科大讯飞认知智能持续突破,机器阅读理解SQuAD测试勇夺第一!
科大讯飞与人民卫生出版社达成战略签约 共望人工智能+医疗美好前景
文 | 讯飞研究院 Pink CC 编 | Pink 责编 | zmwang