查看原文
其他

PocketFlow-由数据及知识驱动的分子生成模型

徐艺然 北京生物结构前沿研究中心
2024-08-30

星标,再也不怕错过更新!方法见文末动图。

在药物发现领域,深度学习技术,尤其是深度生成模型(DGMs),已显示出其在分子设计中的潜力。然而,现有的DGMs大多基于配体,忽视了化学知识和蛋白质结合口袋结构的重要性,这限制了它们在生成具有高生物活性和药物相似性的分子方面的应用。此外,现有数据集规模有限,且依赖于已知的蛋白-配体复合结构,这进一步限制了模型的训练和生成能力。因此,有必要开发一种新的分子生成方法,以克服这些挑战。


2024年3月,Nature Machine Intelligence上提出了一种题为“PocketFlow is a data-and-knowledge-driven structure-based molecular generative model”的分子生成框架。它不仅整合了化学知识和蛋白质结合口袋的结构信息,而且通过引入化学领域的知识指导、拓扑知识、共价键分布建模、三重自注意力机制和迁移学习等技术,提高了模型的鲁棒性和解释性。PocketFlow的目标是在给定蛋白质结合口袋的情况下,从头生成具有创新性的生物活性分子,并通过湿室实验验证其活性和结合模式,从而为药物发现提供一个更有效、更准确的工具。




PocketFlow 框架概述

PocketFlow是一个自回归流模型,它在蛋白质口袋中逐步生成小有机分子。模型通过训练建立从正态分布到3D口袋原子和共价键的映射。在每一步,它提取环境特征,选择焦点原子,然后依次生成原子类型、坐标和共价键。化学知识被用来确保生成分子的结构合理性,如果不符合约束则重新抽样。生成过程在达到最大原子数、焦点原子耗尽或重采样上限时结束。


图1. PocketFlow 的架构和生成过程


PocketFlow的架构和生成过程涉及将蛋白质口袋和已生成的配体片段作为上下文,在每一步中通过上下文编码器提取特征,利用焦点网络选择焦点原子,并基于这些信息生成新原子的类型、坐标和共价键。新原子的类型从正态分布中采样得出,位置通过混合密度网络预测,而共价键的生成则通过三重注意力机制和化学知识引入几何约束来实现。每一步生成后,新原子及其相关信息被整合到上下文中,为下一步的生成提供条件信息。



生成分子的常见属性评估

PocketFlow在分子生成属性评估中表现突出,其生成的分子在QED、LogP和SA方面与真实药物样分子相近,显示出高类药物性和合成可及性。特别是,PocketFlow生成的分子在有效性上达到100%,优于其他基准模型。



生成分子的化学结构合理性

PocketFlow在化学结构合理性评估中表现卓越,无论是在键长、键角还是环结构方面,生成的分子都与真实药物样分子更为接近。分析表明,PocketFlow在九种共价键的键长分布和八种常见键角上均优于其他三个基准模型,且在环结构生成上,PocketFlow能有效避免不受欢迎的环类型,展现出与CrossDocked2020数据集中分子相似的环结构特征,而其他模型则在这些方面存在不足。


图 2. 生成分子的几何结构评估



生成分子的结合位点和配体效率

PocketFlow在结合位点和亲和力/配体效率的评估中表现突出。生成的分子主要集中在蛋白质口袋内部,与其他模型相比,PocketFlow在ChemScore和LE值上均表现更佳,显示出较高的结合亲和力和优化潜力,尤其适合作为药物开发的苗头/先导化合物。


图 3. 不同DGMs生成的1000个随机分子的原子位置分布



湿实验验证

案例1:HAT1

PocketFlow成功生成了针对HAT1酶的潜在抑制剂,该酶与多种疾病相关。通过筛选和生物活性测试,H9分子表现出有希望的抑制效果,并在分子对接中显示出与预测相符的结合位点,初步评估显示其作为苗头化合物的潜力。


图 4. PocketFlow 的应用导致了 HAT1 和 YTHDC1 的新小分子抑制剂的发现


PocketFlow成功生成了两种潜在的抑制剂H9和Y3,分别针对HAT1和YTHDC1酶。H9和Y3的化学结构、剂量-活性曲线以及它们与各自靶标的结合模式通过实验得到了验证。实验数据以平均值±标准偏差表示,并通过分子对接预测进行了比较。特别是,Y3与YTHDC1的复合物的共晶体结构通过X射线衍射得到解析,验证了预测的结合模式,并展示了Y3与YTHDC1的精确相互作用,包括氢键和疏水作用,证实了PocketFlow在生成具有生物活性的分子方面的有效性。


案例2:YTHDC1

PocketFlow成功为YTHDC1设计了活性种子抑制剂,这是一种与急性髓性白血病相关的表观遗传调控蛋白。通过筛选,Y3分子被确定为具有高选择性和生物活性的抑制剂,其结合模式与预测一致,展现出作为潜在苗头化合物的前景。



结论

PocketFlow是一个创新的数据和知识双驱动药物设计模型,能高效生成具有高药物相似性的小分子,并在实验中成功合成了针对特定疾病靶点的活性化合物。尽管模型在结合亲和力和药代动力学特性方面仍有提升空间,但其深度学习在分子生成中的突破性应用,显著提高了前瞻性药物设计的成功率和准确性。PocketFlow不仅扩展了结构基础药物发现的范围,还展示了识别新化学实体的能力,突显了其在生物医药领域的巨大潜力。


供稿 | 徐艺然

责编 | 囡囡

设计 / 排版 | 可洲 王婧曈




微信号:FRCBS-THU

因扫码入群人员已满,可扫码添加中心官方微信号,管理员邀请入群

原文链接

https://www.nature.com/articles/s42256-024-00808-8


精彩回顾

精彩回顾


特别提示

微信公众号又双叒叕更改推送机制了,不是星标的订阅号,收到推送内容的时间会有延迟,甚至根本无法收到最新推送!不想错过FRCBS最新资讯,快来设为星标吧!

方法超简单,只需3秒钟!


点击上方卡片

关注我们吧


THE END

我知道你“在看”


继续滑动看下一个
北京生物结构前沿研究中心
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存