查看原文
其他

The BMJ:科研评估发现,人工智能对于疾病诊断缺乏说服力【研究动态】【2020年第9期】

The BMJ 英国医学杂志中文版 2022-03-25

点击标题下「蓝色微信名」可快速关注



朱蕾蕾 译

University College London Hospital



人工智能(AI),也称为深度学习,根据对当前证据的回顾表明它也许在医学影像检测疾病方面和医生有着相似的精确度1


然而,科研人员建议需要慎下结论,因为缺少高质量的临床研究,也没有能够直接比较人类与机器的表现,或展示AI在真实临床环境下工作情况的确凿证据。


科研组的观点说明AI的诊断能力还是未知领域。


这一发表在Lancet Digital Health杂志上的系统综述和meta分析,审核了2012—2019年发表的31 587篇科研文章,认定其中82篇质量过关,可以纳入分析。来自伯明翰大学的科研人员,通过对69篇文章的审阅,计算出了测试的精确度,灵敏度介于9.7%~100%(平均值79.1%,标准差0.2),特异度在8.9%~100%(平均值88.3%,标准差0.1)。


然后,他们用其中14项研究将AI和医护人员进行比较。科研报告指出,AI汇总灵敏度为87.0%(95%可信区间,83.0~90.2),医护人员为86.4% (79.9~91.0) 。AI汇总特异度为92.5% (95%可信区间85.1~96.4),医护人员为90.5% (80.6~95.7)。


作者写道,"深度学习模式和医护人员在疾病诊断精确度上不相上下。评估深度学习的方法论和报告参差不齐,而且经常不完整。"


"意识到深度学习面临的明确挑战,我们需要针对科研方案和报告制定新的国际标准来确保未来科研的质量及可解释性。"


剑桥大学负责风险与实证传播的温顿中心主席David Spiegelhalter指出,"这篇出色的报告证明,我们对于AI在医学领域的大肆宣传掩盖了几乎所有评价研究的拙劣质量。"


"深度学习可能是一项强大而令人叹为观止的技术,但是临床人员和决策者需要问一个关键问题:AI到底会为临床实践带来什么额外的优势?"


文章声明中有两位作者在这项科研中有潜在的利益冲突。其中一位是DeepMind科技公司外聘的顾问,另外一名是该公司员工。DeepMind和谷歌一样,都是Alphabet公司的子公司。


DeepMind曾经开发过一款应用程序,通过一系列实验室检查,比如通过血常规检查的分析来加速急性肾损伤的诊断。然而,来自伦敦大学学院和伦敦皇家自由医院的科研人员发现这项技术和常规照护过程比起来,没有临床效益2

BMJ 2019;366:l5714 doi: 10.1136/bmj.l5714





您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存