纽约大学与 NVIDIA 携手开发能够预测患者再入院概率的大型语言模型
刊登在《自然》(Nature)上的 AI 模型 NYUTron 已被部署到纽约大学朗格尼健康中心。
从医院出院对病人来说是一座重要的里程碑,但有时这并不代表着他们已完全康复。在美国,有近 15% 的住院病人在首次出院后 30 天内再次入院,并且往往伴随着病情恶化与对患者及院方来说都更高的住院费用。
纽约大学学术医疗中心——纽约大学朗格尼健康中心(NYU Langone Health)的研究人员与 NVIDIA 专家携手开发了一个可预测病人 30 天内再入院风险以及其他临床结果的大型语言模型(LLM)。
这个刊登在科学期刊《自然》(Nature)上的 NYUTron 模型被部署在该医疗系统的六座住院楼中。它能够为医生提供 AI 所驱动的洞察,帮助他们识别需要通过临床干预的病人,以减少患者再入院概率。
纽约大学格罗斯曼医学院放射学和神经外科助理教授、NYUTron 的主要合作者 Eric Oermann 博士表示:“当你让病人出院时,肯定不希望他们需要再回来,或者其实在当时就应该延长病人的住院时间。借助 AI 模型的分析,我们很快就能帮助临床医生预防或解决那些使病人面临更高再入院风险的情况。”
到目前为止,该模型已被应用于纽约大学医疗系统中的 5 万多名出院患者。它会通过电子邮件告知医生再入院风险的预测。Oermann 的团队接下来正计划通过一项临床试验,测试依据 NYUTron 的分析所采取的干预措施是否能够降低再入院率。
应对短期再入院等风险
美国政府追踪 30 日再入院率并以此作为医院的护理质量指标。再入院率高的医疗机构会被处以罚款,这项制度能够激励医院改进其出院流程。
新出院的病人可能会因为感染、过度使用抗生素、过早移除手术引流管等原因而需要再入院。如果这些风险因素能够被更早地发现,医生就可以通过调整治疗计划或延长病人留院观察时间来进行干预。
Oermann 表示:“虽然自 20 世纪 80 年代以来就有了预测病人再入院的计算模型,但我们把它看作一项需要卫生系统规模临床文本语料库的自然语言处理任务。我们使用电子健康记录的非结构化数据训练我们的 LLM,检查它是否能够捕捉到人们之前没有考虑过的洞察。”
NYUTron 使用纽约大学朗格尼健康中心的 10 年健康记录进行了预训练。这些记录由近 40 万名病人超过 40 亿字的临床笔记组成。相比最先进的机器学习模型,该模型预测再入院的准确率提高了 10% 以上。
一旦该 LLM 为 30 天再入院的初始用例进行了训练,该团队就能在一周左右的时间里推出了其他四种预测算法,包括预测病人的住院时间、院内死亡的可能性以及病人保险理赔被拒的几率。
Oermann 表示:“经营一家医院在某些方面就像管理一家酒店。能够帮助医院更高效运营的洞察意味着医院能够腾出更多床位并为更多病人提供更高质量的照护。”
从训练到部署一个 LLM
NYUTron 是一个拥有数亿参数的 LLM。它在一个由 NVIDIA A100 Tensor Core GPU 组成的大型集群上使用 NVIDIA NeMo Megatron 框架训练而成。
Oermann 表示:“如今,大部分关于语言模型的讨论都围绕着具有数十亿参数的超大型通用模型,这些模型使用数百乃至数千个 GPU 在混乱的数据集上训练而成。我们反其道而行之,使用在高度精炼的数据上训练的中等规模的模型来完成特定医疗任务。”
为了优化模型以便在现实医院进行推理,该团队开发了一个修改版的 NVIDIA Triton 开源软件,以便利用 NVIDIA TensorRT 软件开发工具套件简化 AI 模型部署。
Oermann 表示:“像这样的模型必须要高效运行才能被部署到实时医疗环境中。Triton 提供了你在一个推理框架中想要的一切,让我们的模型能够飞速运行。”
Oermann 的团队发现,在对他们的 LLM 进行预训练后,只需使用特定医院的数据在现场进行微调就能大幅提高准确率,这个特点可以帮助其他医疗机构部署类似的模型。
他表示:“并不是所有医院都拥有完全自主训练一个大型语言模型所需要的资源,但他们可以采用像 NYUTron 这样的预训练模型,然后通过云端的 GPU 使用少量本地数据样本对模型进行微调。这对于许多医疗机构来说都是可以做到的。”
如要进一步了解 NYUTron,请阅读《自然》期刊中的论文。点击“阅读原文”,点播观看 NVIDIA 与纽约大学的相关讲座。