The Innovation Medicine | 交互工程激发大语言模型潜能,助力个性化消化系统肿瘤诊疗策略的制定
导 读
相比于当前的医疗技术手段,大语言模型,如GPT-4等在解决医疗健康领域问题上展现出突出的潜力。特别是在医疗诊疗方面,这些模型可能具有突破性的应用价值。在将其应用于临床实践前,我们必须对其技术能力及潜在局限性进行严谨的评估和验证,确保其安全性和有效性。因此,该研究首次专注于优化GPT-4在消化系统肿瘤诊疗方面的应用,创新设计了一系列交互工程(Prompt Engineering)策略,成功引导GPT-4模拟专家医生的诊疗逻辑,为消化系统肿瘤患者制定个性化的诊疗方案。这为证明大语言模型的临床决策支持能力提供了有力证据,也充分展示了工程技术在医学领域的重要应用价值。
图1 图文摘要
健康是促进人的全面发展的必然要求,是经济社会发展的基础条件,是民族昌盛和国家富强的重要标志,也是广大人民群众的共同追求。然而当前医疗行业正面临着诸多困境,包括但不限于成本增加、公平就医机会缺失、人口老龄化、医护人员疲惫、全球大流行病等挑战。这些问题不仅涉及医疗系统的复杂性和资源配置,还与更广泛的社会、经济和伦理问题相交织。过去在智慧医疗领域的尝试虽然在一定程度上有助于解决这些问题,但仍不能全面满足患者多样化和个性化的医疗需求。与当前的医疗技术手段相比,诸如OpenAI的GPT-4大语言模型在解决医疗健康领域现有问题方面展现了突出的潜在优势。从临床角度来看,GPT-4能提供快速的辅助诊断,缩短诊断时间,使医生有更多时间与患者互动。对于患者来说,它能提供个性化的健康建议,提升患者的参与感和满意度。在医疗资源有限的地区,GPT-4的应用能有效缓解医疗资源不足的问题,提升医疗服务质量。然而,引入如GPT-4等大语言模型至医疗领域前,需先对其技术能力和可能存在的局限性进行严谨的评估和验证,以确保其在临床实践中的安全性和有效性。
北京大学肿瘤医院沈琳教授团队和北京大学董彬教授团队合作研发了通过交互工程技术提升GPT-4在消化系统肿瘤诊疗辅助建议方面的功能。该研究提出了三个新颖的交互工程策略:消化系统肿瘤医生角色指令模板、基于向量数据检索的上下文学习(In-context Learning, ICL)和多轮交互。该研究还提出了一套新的诊疗意见的量化评估指标,从病史理解、鉴别诊断、推理、表述规范等多个维度量化评价诊疗方案的质量(图1),其中分值为70、80和90分别相当于低、中、高年资医师水平。由图2可见,相比于简单交互(即不加修饰的直接提问),通过精心构建的交互策略,可使GPT-4更加精确的进行个性化诊疗方案推荐,达到与中高年资医师相近的水平,从而能更加有效的辅助医生诊疗(图2)。
图2 不同交互策略的性能
对比GPT-4基于简单交互和本研究设计的指令模板的问答结果(图3)可以发现,精心设计的消化系统肿瘤医生功能角色指令模板可以帮助GPT-4根据患者的个人情况做出更复杂的决策,其优先考虑控制疾病进展、缓解症状、提高生活质量和延长生存,而不是简单罗列文献治疗指南。
图3 GPT-4基于简单交互和指令模板的问答结果
图4 多轮交互问答结果
图5 基于简单交互和ICL的问答结果
►► 右滑看交互工程的具体能力
针对GPT-4对于医疗病历的理解存在的一些不足之处,团队提出基于多轮交互的方式(图4),通过从专业角度询问GPT-4分期诊断方法,引导并指出其犯的错误,使其快速学会了医生诊疗的思考逻辑,从而纠正其初始诊疗方案建议中的不足。
对比GPT-4基于简单交互和基于向量数据检索的ICL的结果(图5)可以发现,基于ICL交互的GPT-4成功学习采纳了治疗模板病例中医生使用的推理过程和治疗方案,从而生成了更加个性化、更具针对性以及符合医生诊疗习惯的治疗计划,训练结果显著优于简单交互提供的诊疗建议。
总结与展望
该研究展示了通过精心设计的交互工程可以显著提升GPT-4大语言模型在诊疗方案建议方面的能力。在消化系统肿瘤治疗领域,这种模型不仅有望成为医生日常工作中的得力助手,还可能在未来与医生紧密合作,为患者提供更高效、更精确的治疗建议。尽管目前这些模型在医疗应用中仍面临许多挑战,但其潜在的影响和价值也值得进一步深入研究。
责任编辑
孟 夏 复旦大学
张之昊 海南大学
扫二维码|查看原文
原文链接:https://www.the-innovation.org/article/doi/10.59717/j.xinn-med.2023.100019
本文内容来自The Innovation姊妹刊The Innovation Medicine第1卷第2期以Article发表的“Advanced prompting as a catalyst: Empowering large language models in the management of gastrointestinal cancers” (投稿: 2023-07-24;接收: 2023-08-08;在线刊出: 2023-08-14)。
DOI: https://doi.org/10.59717/j.xinn-med.2023.100019
引用格式:Yuan J., Bao P., Chen Z., et al. (2023). Advanced prompting as a catalyst: Empowering large language models in the management of gastrointestinal cancers. The Innovation Medicine 1(2), 100019.
作者简介
沈 琳,北京大学,主任医师、教授,北京学者。长期致力于消化道肿瘤精准药物治疗,以及抗肿瘤新药I- III期临床试验与转化研究;国家重点研发计划“胃癌靶向治疗新技术研究”首席,承担973/863子课题、国自然、首发等重点项目9项,国际合作/横向课题20余项。牵头制定亚洲及中国胃癌、中国肠癌/GIST诊疗共识、指南、规范;牵头新药临床研究:胃癌靶向、免疫治疗药;食管癌首个国际国内一二线免疫治疗新适应症;牵头首个国内跨瘤种超选人群、首个皮下注射PD-L1单抗、首个国内ADC药物临床研究并获批适应症,同时改变HER2阳性临床定义;牵头首个CAR-T实体瘤临床试验等。
董 彬,北京大学,北京国际数学研究中心长聘教授、国际机器学习研究中心副主任、国家生物医学成像科学中心研究员,北京大学长沙计算与数字经济研究院副院长。2003年本科毕业于北京大学数学科学学院、2005年在新加坡国立大学数学系获得硕士学位、2009年在美国加州大学洛杉矶分校数学系获得博士学位。博士毕业后曾在美国加州大学圣迭戈分校数学系任访问助理教授、2011-2014年在美国亚利桑那大学数学系任助理教授,2014年底入职北京大学。主要研究领域为科学计算、计算成像、机器学习。2014年获得求是杰出青年学者奖,2022年受邀在世界数学家大会(ICM)做45分钟报告。
往期推荐
| |||
| |||
| |||
| |||
| |||
| |||
| |||
|
The Innovation 简介
扫二维码 | 关注期刊官微
The Innovation是一本由青年科学家与Cell Press于2020年共同创办的综合性英文学术期刊:向科学界展示鼓舞人心的跨学科发现,鼓励研究人员专注于科学的本质和自由探索的初心。作者来自全球55个国家;已被136个国家作者引用;每期1/5-1/3通讯作者来自海外。目前有196位编委会成员,来自21个国家;50%编委来自海外;包含1位诺贝尔奖获得者,37位各国院士;领域覆盖全部自然科学。The Innovation已被DOAJ,ADS,Scopus,PubMed,ESCI,INSPEC,EI等数据库收录。2022年影响因子为32.1,CiteScore为23.6。秉承“好文章,多宣传”理念,The Innovation在海内外各平台推广作者文章。
期刊官网:
www.the-innovation.org
www.cell.com/the-innovation
期刊投稿(Submission):
www.editorialmanager.com/the-innovation
商务合作(Marketing):
marketing@the-innovation.org
Logo|期刊标识
See the unseen & change the unchanged
创新是一扇门,我们探索未知;
创新是一道光,我们脑洞大开;
创新是一本书,我们期待惊喜;
创新是一个“1”,我们一路同行。
The Innovation 姊妹刊
生命科学 第1卷第2期 | 地球科学 第1卷第2期 | 材料科学 第1卷第2期 | 医学 第1卷第2期 |
生命科学 第1卷第1期 | 地球科学 第1卷第1期 | 材料科学 第1卷第1期 | 医学 第1卷第1期 |
The Innovation
第4卷第5期 | 第4卷第4期 |
第4卷第3期 | 第4卷第2期 | 第4卷第1期 | 第3卷第6期 |
第3卷第5期 | 第3卷第4期 | 第3卷第3期 | 第3卷第2期 |
第3卷第1期 | 第2卷第4期 | 第2卷第3期 | 第2卷第2期 |
第2卷第1期 | 第1卷第3期 | 第1卷第2期 | 第1卷第1期 |