查看原文
其他

成都先导与腾讯AI Lab合作开发分子骨架跃迁新算法

先导药物 智药邦 2022-06-15

成都先导药物开发股份有限公司(以下简称“成都先导”)的研发团队深入研究人工智能(AI)在药物发现领域的应用,与腾讯AI Lab合作,共同设计开发了一款分子骨架跃迁算法(GraphGMVAE)。该算法可以在保持分子侧链不变的情况下,生成具有相似活性不同骨架的分子。此外,我们还提出了一套对分子进行优先级排序的流程,可以缩小验证范围,该结果发表于最新一期ACS Omega上。







图1. 研究结果文章发表(数据更新至2021年9月7日)


骨架跃迁的意义

骨架跃迁是药化设计中的重要工具,其主要目的有:(1)在已有的化合物分子结构上,产生新颖的化合物系列,增加药物研发成功率;(2)替换复杂天然产物的局部结构,产生更具选择性、更优活性的新颖分子;(3)通过改变分子的骨架,进而改善分子的药代动力学性质。


商业软件中的传统骨架跃迁算法大都受限于骨架数据库的大小、较长的计算时间或昂贵的许可证,而基于深度学习的骨架跃迁算法又很少。基于此,成都先导和腾讯AI Lab合作开发了GraphGMVAE算法,该算法采用风格迁移的思想,运用深度图学习与高斯混合分布隐空间相结合,能够针对目标靶点的参考分子进行骨架跃迁,有望加快药物研发领域中的小分子设计环节,从而大大减少人力以及时间成本。








图2. 利用 GraphGMVAE 进行骨架跃迁


方法


骨架提取和聚类

构建GraphGMVAE之前需要提取分子的骨架。如图3所示,算法应用了ScaffoldGraph的算法提取了一个骨架集合,并结合人工规则删除了结构过于简单和常见的骨架,以及分子量过大的复杂骨架。







图3. BM骨架与ScaffoldGraph骨架


GraphGMVAE模型

模型的总体结构如图4所示,使用了通道消息传递神经网络来编码分子结构及其特性。将骨架嵌入到高斯混合分布的隐空间,保持同簇的骨架属于相同的高斯质心。最后,一个基于门控循环单元(GRU)的解码器用来将嵌入的编码恢复到广泛用于化合物分子描述的语言SMILES。







图4. GraphGMVAE模型主要组成


假设骨架的隐空间符合高斯混合分布,侧链使用自编码器,这样就可以在不同的高斯核之间进行骨架的跃迁,但侧链保持不变。使用不同的跃迁率进行采样,可以从参考化合物所在参考簇、附近簇,以及较远的簇生成三组新分子,如图5所示。







图5. 通过高斯混合分布从参考簇(绿色圆圈)、附近簇(红色圆圈)和远处簇(蓝色圆圈)采样生成的分子。分子下的数字代表与参考化合物的相似性。


对 GraphGMVAE 生成的分子进行优先级排序

为了缩小评估范围,我们提出了优先级排序流程(图6)。通过GraphGMVAE生成的数以万计的分子首先通过药物相似性和基于规则的MedChem过滤器进行过滤,以去除潜在的毒性分子或具有反应性的官能团或较差药物特性的分子。然后,进行药效团筛选、分子对接、3DCNN活性预测。在上述流程之后,选择了25个具有高对接分数和3DCNN亲和力分数的分子,进行新颖性检查,根据合成可行性选择了其中的七个分子进行化学合成。







图6.分子优先级的排序流程


JAK1靶点的新型抑制剂


作为一个验证性案例,我们选用Upadacitinib作为参考化合物来进行骨架跃迁,以期找到新颖的JAK1抑制剂。具体讲,GraphGMVAE算法一共生成了3万个分子,其中97.9%的分子具有不同于已知 JAK 抑制剂的新型骨架。最后选择了其中七个分子进行合成和实验验证,具体的结果和生物活性如图7。值得注意的是,其中,Ten01Ten02分子的活性甚至优于参考分子。







图7. 参考化合物与新合成化合物结构和抑制活性


总结


成都先导一直以来都在AI领域进行持续的探索与研究,特别是如何把AI技术与其核心技术DEL/FBDD/SBDD有效结合,更加高效地探索化学空间,这对创新药小分子的发现与优化具有十分重要的意义。此次成都先导与腾讯AI Lab合作设计了一种分子生成的骨架跃迁算法(GraphGMVAE)和提出了一种对分子进行优先级排序的流程。以JAK1抑制剂Upadacitinib为例,证明了我们的模型在药物发现中的适用性,可以像人类专家一样以有效和准确的寻找新的候选分子。


参考文献

Yu, Y. et al. A Novel Scalarized Scaffold Hopping Algorithm with Graph-Based Variational Autoencoder for Discovery of JAK1 Inhibitors. ACS Omega (2021) doi:10.1021/acsomega.1c03613.


----------- End -----------




感兴趣的读者,可以添加小邦微信(zhiyaobang2020)加入读者实名讨论微信群。添加时请主动注明姓名-企业-职位/岗位 或姓名-学校-职务/研究方向






历史文章推荐    


Science|让机器学习值得信赖
Science China|用增强的联邦学习应对药物发现数据小和偏的困境
Drug Discov Today|药物研发风险地图
Drug Discov Today|FDA童伟达:基于AI的语言模型为药物发现和开发提供动力
Nature Outlook|借助算法和模拟将蛋白质折叠的瞬时结构转变为药物靶点
AI药物发现公司继续寻求最佳商业模式
人工智能在药物研发中的应用
远程机器人实验室在AI药物发现中的应用价值与前景
2020年AI + 药物研发全景概述:(二) AI如何应对制药行业的效率挑战
20家顶尖制药公司如何将AI应用于药物研发:近年来主要合作活动

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存