GTC23 | NVIDIA 发布大型语言模型和生成式 AI 服务以推动生命科学研发
作为 NVIDIA AI Foundations 的一部分,全新 BioNeMo 云服务加速生命科学研究、药物研发和蛋白质工程
加利福尼亚州圣克拉拉 - GTC - 太平洋时间 2023 年 3 月 21 日 – NVIDIA 今日推出一整套用于自定义 AI 基础模型的生成式 AI 云服务。这些服务将加速新蛋白质和治疗方法的创建以及基因组学、化学、生物学和分子动力学等领域的研究。
作为 NVIDIA AI Foundations 的一部分,用于 AI 模型训练和推理的全新 BioNeMo™ 云服务产品能够加速药物研发过程中最耗时、费用最高的阶段。研究人员能够依靠它在自己的专有数据上对生成式 AI 应用进行微调,并可以直接通过网络浏览器或者全新云应用编程接口(API)运行 AI 模型推理,并轻松集成到现有应用中。
NVIDIA 医疗业务副总裁 Kimberly Powell 表示:“生成式 AI 的革命性力量为生命科学和制药行业开辟了巨大的前景。NVIDIA 与该领域先锋企业的长期合作,推动了 BioNeMo 云服务的发展。这项服务现在已经被当作一个 AI 药物研发实验室,它可提供预训练模型,并使用专有数据自定义服务于药物研发流程各阶段的模型。这能够帮助研究人员识别正确的靶向目标、设计分子和蛋白质并预测它们在人体内的相互作用,从而研发出最佳的候选药物。”
早期用户——安进
世界领先的生物技术公司安进(Amgen)已经在使用这项服务推进其研发工作。
安进数字创新研究加速中心、生物治疗研发部执行总监 Peter Grandsard 表示:“ BioNeMo 大大加快了我们的生物制剂研发流程。凭借这项服务,我们可以在安进的专有数据上预训练用于分子生物的大型语言模型,使我们能够探索和研发出新一代药物中的治疗性蛋白质来帮助治疗患者。”
生成式 AI 大幅加快药物研发流程
BioNeMo 云服务包含预训练的 AI 模型,以帮助研究人员建立 AI 药物研发流程。该服务已被包括 Evozyne 和 Insilico Medicine 在内的药物研发企业用于支持数据驱动的新候选治疗药物的设计。
生成式 AI 模型能够快速识别潜在的药物分子,在某些情况下可从零开始设计出化合物或基于蛋白质的治疗药物。这些模型在小分子、蛋白质、DNA 和 RNA 序列的大型数据集上进行训练后,可以预测蛋白质的 3D 结构和分子与目标蛋白质对接的程度。
新的生成式 AI 模型在 BioNeMo 服务上
提供早期访问
除了之前公布的 MegaMolBART 生成式化学模型、 ESM1nv 蛋白质语言模型和 OpenFold 蛋白质结构预测模型之外,BioNeMo 现在又加入了 6 个经过优化的全新开源模型,包括:
AlphaFold2:DeepMind 开发的一个深度学习模型,其能够将确定蛋白质结构所需的时间从几年缩短到几分钟甚至几秒,仅需要使用蛋白质的氨基酸序列。该模型已经被 100 多万研究人员使用。
DiffDock:为了帮助研究人员了解药物分子如何与目标蛋白结合,该模型以高精度和高计算效率预测小分子的 3D 方位和锚定反应。
ESMFold:这个蛋白质结构预测模型使用 Meta AI 的 ESM2 蛋白质语言模型,可以基于单个氨基酸序列来预测蛋白质的 3D 结构,而不需要类似序列的样本。
ESM2:该蛋白质语言模型用于推理蛋白质的机器表示,对蛋白质结构预测、属性预测和分子对接等下游任务很有用处。
MoFlow:用于分子优化和小分子生成,这个生成化学模型重新创建分子,提出潜在治疗药物的各种化学结构。
ProtGPT-2:这个语言模型生成新的蛋白质序列,帮助研究人员设计具有独特结构、属性和功能的蛋白质。
BioNeMo 服务使用户可以通过一个浏览器界面轻松访问这些生成式 AI 模型,进行互动推理并实现蛋白质结构的可视化。研究人员将 BioNeMo 与 NVIDIA DGX Cloud™ 上的超级计算资源组合后,就可以在使用 NVIDIA Base Command™ 平台和 NVIDIA AI Enterprise 软件套件的全托管软件服务上自定义他们的模型。
制药公司和初创企业利用 BioNeMo
优化 AI 工作流程
制药公司和药物研发初创企业正在使用 BioNeMo 并且多次取得显著的成果。
安进使用其专有的抗体专利数据对 BioNeMo 的 ESM 模型架构进行了预训练和微调。该公司将在 DGX Cloud 上训练五个用于分子筛选和优化的自定义模型所需要的时间从三个月缩短到几周。
芝加哥生物技术公司兼 NVIDIA 初创加速计划成员 Evozyne 的研究人员与 NVIDIA 联合开发了一个基于 BioNeMo 的深度学习模型—Protein Transformer Variational AutoEncoder。这个生成式 AI 模型在 Evozyne 专有的蛋白质数据上进行了微调,研究人员用它可设计出性能明显高于自然界中的酶的合成变体。
NVIDIA 初创加速计划高级成员 Insilico Medicine 正在使用 BioNeMo 加速早期药物研发流程。该流程在过去需要花费四年多的时间,成本约 5 亿美元。Insilico 使用了端到端的生成式 AI ,只用了三分之一的时间和十分之一的成本就能识别出一种临床前候选药物。该药物预计很快将进入二期患者临床试验阶段。
在 GTC 上了解 AI 和医疗行业的最新进展,包括安进演讲者主持的三场分会、Evozyne 演讲者主持的一场分会和 DeepMind 演讲者主持的另一场关于 AlphaFold 的分会。
免费注册观看 NVIDIA 创始人兼首席执行官黄仁勋 GTC 主题演讲,了解 BioNeMo 云服务。
扫描海报二维码,或点击“阅读原文”,即可观看 NVIDIA 创始人兼首席执行官黄仁勋 GTC23 主题演讲重播!
百里挑一!
3 月 23 日不可错过的演讲!
GTC23 | 黄仁勋与 Ilya Sutskever 的炉边谈话重磅来袭!— 看 AI 的现状和未来