其他
Drug Discov Today|用于从头药物设计的图神经网络GNN
2021年6月,来自中科院上海药物所的蒋华良、郑明月等人在Drug Discovery Today发表综述,从分子打分、分子生成和优化、合成规划3个方面,介绍了GNN在从头药物设计中的应用,并探讨了该领域的当前挑战和未来方向。
GNN在药物分子设计领域被广泛关注。 GNN在分子打分、分子生成和优化以及合成规划中的应用。 GNN在从头药物设计中的当前挑战和未来方向。
摘要
前言
分子打分
基于配体的打分
基于受体的打分
分子生成和优化
分子的生成和优化是自动药物从头设计的核心。生成模型的方法通常分为2类:非自回归方式(图4a)和自回归方式(图4b)。非自回归生成模型通过同时生成图的边特征矩阵和节点特征矩阵来构建分子图。非自回归生成模型包括变分自编码器(VAE)、生成对抗网络(GANs)和基于可逆流的模型。自回归生成模型通过迭代细化图的中间结构来构建图。自回归生成模型的典型代表是RNN。这些不同类型的生成模型也可以组合使用,如自回归VAE和自回归流模型。此外,分子作为一种特殊的图结构数据,也可以通过虚拟化学反应生成(图4c)。目前,深度生成模型的性能通常用以下指标进行评估:(i)有效性,即生成的图形对应于有效分子的百分比;(ii)新颖性,即生成的有效分子不存在于训练集中的百分比;(iii)唯一性,所有生成分子中唯一有效分子所占百分比。目前,生成符合化学规律的新型分子的方法已经比较成熟。许多生成模型能够针对 ZINC 数据集实现几乎 100% 的有效性和新颖性。然而,对于从头在药物设计中,仅设计独特且不违反价态规则的分子是不够的。生成的分子应该具有合适的性质,这需要通过实验来证明。实验结果也可以反馈给生成模型,最终形成循环。然而,分子合成的困难限制了这一过程的实施。目前,通过虚拟筛选或高通量筛选对库存化合物进行筛选仍是药物发现的主流方法。提高生成分子的可合成性应该是下一阶段生成模型研究的最重要目标之一。
我们认为生成模型和综合规划模型的结合将是一个有价值的研究方向。此外,生成模型的新评估指标也值得探索。目前,评估深度生成模型的常用指标只有有效性、新颖性和唯一性。诚然,这3个指标可以直观地反映模型探索化学空间的效率以及模型的一些潜在问题,例如“模型崩溃(mode collapse)”。但是,它们不能反映模型生成分子的质量。最近,Bush等人提出了“图灵测试(Turing test)”,将算法生成的分子与药物化学家生成的分子进行比较,是对生成模型创建的分子进行评估的积极尝试。
合成规划
结语和展望
感兴趣的读者,可以添加小邦微信(zhiyaobang2020)加入读者实名讨论微信群。添加时请主动注明姓名-企业-职位/岗位 或姓名-学校-职务/研究方向。
Science China|用增强的联邦学习应对药物发现数据小和偏的困境
岳石怡|人工智能+分子生成
BioRxiv|基于表型和化学结构预测化合物活性
Nat Biotech|北京大学谢正伟:利用深度学习从转录谱中预测药效
Drug Discov Today综述|分子从头设计和生成模型
Nature:如何使用AI分析真实世界数据,简化肿瘤临床试验入组标准
AI药物研发公司Insilico Medicine的理念、技术与特点
2020年AI + 药物研发全景概述:(二) AI如何应对制药行业的效率挑战
20家顶尖制药公司如何将AI应用于药物研发:近年来主要合作活动