前沿|Nature和柳叶刀等顶刊中的ChatGPT和医疗领域自然语言处理研究前瞻
来自:上海市数字医学创新中心
ChatGPT自发布以来,在世界范围内持续引发关注和讨论。它能够完成包括诗歌创作、论文写作、编码问题解决以及复杂概念的解释等任务。其优异的交互表现引发了国内外医疗领域人士的关注。
它有可能用于医疗场景吗?如何解决它“一本正经胡说八道”的缺陷?它将成为人类的助手还是将替代人类作业?从科学研究和医疗从业者的角度出发,我们整理了一些顶刊中对于大型语言模型(LLM)的思考,以期在人工智能技术蓬勃发展的今天,窥见未来大模型在医疗领域的可能性。
Nature
News Feature
What ChatGPT and generative AI mean for science
Chris Stokel-Walker, Richard Van Noorden
不少科学研究者们已经开始在他们的工作中尝试使用ChatGPT一类的大模型,有学者将ChatGPT用来辅助检查代码、启发灵感、当做数字化的助手也有不少学者表达了对这类生成式人工智能大模型的忧虑:生成的内容流畅,但缺乏可靠性;难以在专业的知识领域中给出可靠的回答;对模型输出内容的把控仍有待进步(偏见或种族主义内容);其生成内容中潜在的侵权风险;以及即便使用算法,人们仍然面临难以区分AI生成内容与人类创作内容的困扰……
“Scientists are not going to sit and write long introductions for grant applications any more, they’re just going to ask systems to do that.”
DOI: 10.1038/d41586-023-00340-6
Nature Medicine
Editorial
Will ChatGPT transform healthcare?
14 March 2023
以ChatGPT为代表的大型语言模型(LLM)已在内容营销、客户服务等商业场景中投入了使用,编辑认为类似的模型也将很快进入到医疗健康领域之中,用于改善健康并提高患者的生活质量(如帮助患者理解专业信息,更好地遵从医嘱;根据具体的医疗需求定制模型,提高某些疾病患者的治疗效果;帮助医疗专业人士远程赋能专业资源稀缺或者水平不足的区域)。
编辑也同时强调,这类模型需要注重严格的临床测试和专家评估,以确保其可靠性和安全性,也需要所有的相关利益者积极参与、合作,制定相应的标准和规范,探索一个兼具建设性和预警性的监管环境。
“...Augmenting rather than replacing human expertise, and ultimately improving quality of life for many patients”
DOI: 10.1038/s41591-023-02289-5
The Lancet Digital Health
Comment
ChatGPT: the future of discharge summaries
Sajan B Patel, Kyle Lam
St.Mary’s Hospital, London, UK
英国圣玛丽医院的研究者认为ChatGPT在医疗领域的一种潜在应用是生成出院总结(Discharge Summaries)。以自动化的方式减轻初级医生的工作负担,同时以相对标准化的方式提高出院总结的质量。他们也认为将通用领域的ChatGPT部署到临床实践中还面临着许多挑战:解决数据输入和数据治理问题,同时必须重视数据存储和访问问题;自动化可能导致医疗护理的去人格化,从而使相关利益方抗拒使用该技术;考虑到错误或不充分信息可能会严重影响患者护理,医生仍需要在完成出院总结前对ChatGPT生成的内容进行手动检查。
“Proactive early adoption of this technology at a central level might also reduce the risk of issues in the future.”
DOI:10.1016/S2589-7500(23)00021-3
Using ChatGPT to write patient clinic letters
Stephen R Ali, Thomas D Dobbs, Hayley A Hutchings, Lain S Whitaker
Swansea University Medical School, UK
医患之间临床信息的适当记录和传递已变得越来越重要,英国斯旺西大学医学院的研究者们认为,ChatGPT一类的AI有可能生成高质量、可被患者理解的临床信件 (Clinical Letters),同时提高效率、一致性、准确性、患者满意度,并为医疗保健系统节约成本。他们以皮肤癌的临床沟通场景为蓝本,设计了ChatGPT生成面向患者的临床信件的研究,用以评价该模型在有限的临床输入条件下,应用于临床信息沟通的总体正确性和人性化程度。
“Caution must be exercised and potential risks must be proactively addressed to ensure the safety and quality of patient care while introducing such an important technical advancement.”
DOI:10.1016/S2589-7500(23)00048-1
自然语言处理(NLP)是人工智能与医疗结合的研究热点之一。医生的诊断报告、病人的病历记录、医学文献等非结构化信息,可通过自然语言处理技术,加以提取、进行知识发现和数据挖掘,辅助医护人员进行诊断、分析治疗方案或发掘研究方向。
随着GPT时代的开启,自然语言处理与医疗的结合也将越来越深刻。本期内容,我们整理了部分顶刊中有关NLP与医疗结合的研究,与人工智能和医疗行业的研究者们分享近来该领域的国内外前沿进展。
The Lancet Digital Health
Article
Deep learning with weak annotation from diagnosis reports for detection of multiple head disorders: a prospective, multicentre study
Tsinghua University, Chinese PLA General Hospital
一般来说,构建准确且具有普适性的深度学习系统,需要投入较为高昂的成本,建设有高质量标注的大量训练数据集。该研究提出了一种新的深度学习系统,它无需标注人员,而是从诊断报告中提取弱标注信息,构建一种名为RoLo的弱监督学习算法,分析头部CT扫描,检测多种头部疾病(包括出血、缺血、肿瘤和颅骨骨折)。
该系统基于中国人民解放军总医院10万余个头部CT扫描和相应的诊断报告开发,经过回顾性测试集、前瞻性测试集、跨中心测试集、跨设备测试集和跨国家测试集的测试,其对四种头部疾病类型检测的AUC分别达到0.976、0.975、0.971和0.964。在没有专家标注数据的情况下,该系统对部分头部疾病的检测水平与参与验证测试的放射科医生水平类似,并帮助医生提高了灵敏度和特异度。
https://doi.org/10.1016/S2589-7500(22)00090-5
Nature npj Digital Medicine
Review Article
A survey on clinical natural language processing in the United Kingdom from 2007 to 2022
University College London, University of Edinburgh, University of Oxford, University of Birmingham, University College London Hospitals NHS Trust, Queen Mary University of London, South London and Maudsley NHS Foundation Trust, University of Cambridge, King’s College London
许多用于支持高质量临床研究所需的信息和知识都以文本的形式储存,而自然语言处理已经被用于从这些文本中提取信息。本文对过去15年来英国的临床自然语言处理领域进行了全面回顾,从发展趋势(投入资金、项目数量和组织机构)、具有重要影响力的组织机构(大学、NHS、产业)和该领域内自然形成的4个主要集群进行了回顾分析,来发掘该领域在英国的主要参与者、领域研究与发展方向、技术成熟程度的变化、资金投入的需求、该领域面临的障碍及未来研发的方向。
https://doi.org/10.1038/s41746-022-00730-6
Article
Cohort design and natural language processing to reduce bias in electronic health records research
Massachusetts General Hospital, Broad Institute of Harvard and the Massachusetts Institute of Technology, Brigham and Women’s Hospital, Harvard Medical School, Bayer AG
电子健康记录(EHR)对生物学发现和临床洞察的意义越来越显著,但EHR数据容易受到各种偏差和缺失的影响(患者选择、数据获取等问题)。为了减少这些偏差的影响,该研究通过利用多机构EHR数据,对2001-2018年接受长期初级保健的患者进行采样,构建了C3PO的队列,利用NLP技术从非结构化文本中恢复生命体征数据,并通过部署已建立的风险模型来验证C3PO的有效性。
通过对比便利样本与队列数据,研究发现NLP技术能够减少生命体征的缺失率,帮助减少EHR数据研究偏差并放大其普适性。
https://doi.org/10.1038/s41746-022-00590-0
希望对你有所收获!
更多硬核干货医疗科技内容,请将我们设为星标!
请添加俱乐部小助手微信,备注“姓名-单位”,小助手每天会集中通过邀请进入俱乐部实名交流群,如果已在群中,请勿重复操作。实名交流群用于每天医疗科技资讯分享,不用于广告发布、课程销售、产品推广。如有违规,将被拉入俱乐部黑名单。
我们成立组织的目的在于务实高效学习医疗科技知识,所以重点不只是交流,更多在于学习和创造,为此我们设置了一些小门槛,成立了VIP项目。每周汇总最值得关注的生物医疗科技深度资讯、每月深度解读一个方向的一本经典图书,并邀请相关论文作者做客分享,我们也会组织线下论坛和研讨,集中探讨相关内容,比如上个月我们组织的生物人工智能与精准医疗活动。欢迎加入VIP项目,和我们一起务实奋进。
四月活动|单细胞测序分析、微量血样多组学、数字医疗、图神经网络、零样本学习
VIP读书会预告|微软副总Peter Lee《医学中的人工智能革命:GPT-4及以后》
读书会|「Lifespan:Why we age and why we don't have to」
加入VIP请看这里~
HealthX禾飒扁鹊医疗科技俱乐部VIP会员、师生医护认证会员申请