社论 | ChatGPT等大型语言模型开启了数字医疗的新篇章
《柳叶刀-数字医疗》(The Lancet Digital Health)发表社论指出,大型语言模型已经在医疗服务的多个领域显示出了它的价值。一些耗时费力的行政类健康服务分散了健康服务工作人员的注意力且限制了他们提供高质量患者照护的能力,给他们带来了沉重的负担,而大型语言模型可以在自动化这些耗时费力的工作方面发挥巨大作用。我们希望《柳叶刀-数字医疗》能成为一个创新的平台,我们认为这些创新应该超越质量和可靠性指标,强调不同人群的包容性,解决与大型语言模型相关的潜在局限性和偏倚,并评估其临床实施、成本效益和医学研究中的伦理应用。
自2022年11月推出GPT-3.5以来,ChatGPT的用户群仅用了5天就达到了100万,现在有大约1.8亿用户。大型语言模型(large language models, LLMs)是ChatGPT的底层模型——全球都对它的巨大潜力产生了无限兴趣。LLMs在2023年已经在多个领域取得了不同的进展,但它们将如何在2024年影响患者健康?
LLMs已经在医疗服务的多个领域显示出了它的价值。Singhal及其同事[1]描述了一种LLMs,Med-PaLM,它可以为医学问题提供高质量和准确的答案。MedQA是一个美国医师执照考试模拟考题数据集,Med-PaLM在回答MedQA时的准确率为67%,比之前最先进人工智能(AI)工具的准确率高17%。此外,尽管Med-PaLM与临床医生相比仍有不足,但是它也显示出了比较好的医学理解、知识检索和推理能力。LLMs还可以帮助教育患者及其家属。Lim及其同事[2]的研究表明,LLM聊天机器人对近视相关的健康问题提供了全面的回应;同时,Goodman及其同事[3]的研究显示,GPT-3.5和GPT-4在解决17个不同医学专业的复杂医疗问题方面非常准确。LLMs准确解答医学问题,通过快速提供最新信息以及支持医学继续教育,进而影响患者健康。
LLMs仍有一些不足,亟需解决。Zack和Lehman及其同事[4]表明,当被要求生成临床场景时,GPT-4不能准确代表医疗环境中的人群多样性,通常会产生刻板印象。此外,GPT-4的鉴别诊断和治疗方案显示了一些人口统计学特征与更昂贵方案之间的关联,突出了LLM偏倚的风险。LLMs也会产生不正确或无意义的内容,这种现象被称为幻觉(或虚构)[5],这意味着它会提供不正确或不安全的医疗建议,这对那些知识有限或无法辨别信息准确性的人来说尤其危险。
LLMs可以在自动化耗时费力的行政类健康服务方面发挥巨大作用,这些任务限制了健康服务工作人员的注意力和提供高质量患者照护的能力,给他们带来了沉重的负担。例如,出院总结可以使用ChatGPT自动完成[6]。还有一个LLM对接了符合HIPAA法案(Health Insurance Portability and Accountability Act)要求的美国电子健康记录(EHR)系统,为患者提供个性化服务,并优化转诊总结[7]。但是,为了患者安全,LLMs生成的内容应由医疗服务专业人员审核。
LLMs的开源代码和数据是支持LLMs在医疗服务领域广泛应用的基础,因为这样可以提高透明和合作。然而,由于模型的知识产权和商业利益,训练数据中包含敏感信息而形成的数据隐私,以及依赖对大量计算资源而产生的高成本,这都导致这种实践并不常见。不过,为了促进研究、合作和模型性能比较,已经为包括医学在内的不同领域提供了一系列开放LLMs[8]。
总的来说,LLMs可能会在2024年影响患者健康,为医疗问题提供准确的答案,协助诊断和治疗方案,以及在其他应用中自动化管理医疗服务任务。随着我们在2024年开启数字健康的新篇章,我们预计将进行更大规模的外部验证研究,基于新型LLMs开展广泛的医学应用。我们希望《柳叶刀-数字医疗》能成为一个创新的平台,我们认为这些创新应该超越质量和可靠性指标,强调不同人群的包容性,解决与LLMs相关的潜在局限性和偏倚,并评估其临床实施、成本效益和医学研究中的伦理应用。此外,提升开源代码和数据的可及性、采用协作研究以及确保数据隐私和敏感信息保护是在医疗服务中适当使用LLMs的主要考虑因素。END
参考资料
[1] https://www.nature.com/articles/s41586-023-06291-2
[2] https://www.sciencedirect.com/science/article/pii/S2352396423003365?via%3Dihub
[3] https://jamanetwork.com/journals/jamanetworkopen/fullarticle/2809975
[4] https://www.sciencedirect.com/science/article/pii/S258975002300225X?via%3Dihub
[5] https://journals.plos.org/digitalhealth/article?id=10.1371/journal.pdig.0000388
[6] https://www.thelancet.com/journals/landig/article/PIIS2589-7500(23)00021-3/fulltext
[7] https://www.epic.com/epic/post/cool-stuff-now-epic-and-generative-ai/
[8] https://github.com/eugeneyan/open-llms
题图 Copyright © 2024 iStock/Getty Images Plus
中文翻译仅供参考,所有内容以英文原文为准。
推荐阅读
柳叶刀-数字医疗 | COVID-19期间数字医疗研究的传播需要在速度与质量间取得平衡
点击阅读原文,查看更多内容