查看原文
其他

Dr.X | 一文读懂,这些药物发现环节 AIDD 更可发力

Dr.X 药时代 2022-09-21



近年,随着先进的人工智能算法被应用于药物发现,AI 辅助的药物发现越来越受到关注并已开始发挥作用。

在与经典药物发现的对话中,AI 药物发现需要对一些关键问题做出解答,才能说明其原理、展示其价值:

● AI 能被用在哪些具体环节;
● 哪些具体问题用 AI 能更好地解决;
● 用 AI 这个“黑盒子”做评估筛选可靠吗;

日前,晶泰科技高级算法工程师郑莲君博士在晶泰智播中,以经典药物研发流程为脉络,从技术层面阐述 AI 方法是如何回答以上核心问题,并以实例展示 AI 技术的引入为传统流程带来的新变化及优势。点击收看回放。



药物设计的结合位点确认

靶点结构是基于结构药物设计的基础。结构生物学手段,特别是基于冷冻电镜的单颗粒分析技术对未知结构的靶点蛋白研究带来了革命。但从获取三维结构信息到确认可用于药物设计的结合位点还需跨越巨大的技术鸿沟。AI 可发挥价值的两大步骤包括对未知结合口袋和关键相互作用位点确认。

晶泰科技自有冷冻电镜系统及结构解析工作流程

● 从数据库大量靶点-配体晶体结构提取空间与药效团特征并构建训练卷积神经网络,推算靶点倾向与配体结合的区域。此法可有效替代人工搜索匹配的方法,有更好的迁移性和预测能力,特别当训练集中包含有相似靶点或相似口袋微环境时效果更佳。在此基础上,充分考虑结合口袋的空间尺度特点,通过数学形态学的方法实现口袋标记、亚口袋探测划分并辅助口袋内的结合构象分析,为后续高精度对接、确定最佳结合模式提供起始。
● 当不存在已知配体报道时,对结合口袋完成药效团识别并以多种药效团类型探针探测口袋深度、疏水基团附近氢键相互作用区域等,辨别对结合起重要作用的热点氨基酸。此步骤对 PPI 类药物设计至关重要。

某激酶靶点上识别出的药效团(网状球),探测得到的蛋白热点区域,其中关键的氢键相互作用区域(红色格点)与疏水区(灰色格点)与SAR分析结果基本吻合。【图片为晶泰科技自有数据】


分子生成

得益于 AI 神经网络能提取数据规律的特征,利用 AI 对庞大类药化学空间探索(趋向于 1060),获得大量具有全新结构的化合物,是AI在药物发现中较被人熟知的应用。根据化合物结构被信息化输入并读取的方式不同,分成基于序列、基于片段、基于形状的三大类生成方式;同时,考虑到多种应用场景需求和属性条件,还有不同侧重的分子生成方式,各具特色和优势。无论何种生成方式,所得化合物结构的合法性和多样性等性质都具有基本保证,辅以参考分子、骨架、药效团、蛋白口袋等信息,以及迁移学习、强化学习、分子杂交等策略,实现定向生成。



主动学习指导的虚拟筛选

以 AI 主动学习策略结合打分搭建的高通量虚拟筛选工作流程,通过多轮的 AI 模型训练与采样迭代,仅需计算部分分子即完成库筛选,大大节省计算成本,实现超高通量虚拟筛选。在内部测试项目中,对 800 万的化合物库进行虚拟筛选,仅需计算 5-10% 的分子数即趋于收敛,召回>70% 的化合物分子。值得指出的是,筛选过滤后的化合物库中,骨架种类无明显减少,依旧保持了多样性(见下图)。



性质评估与多目标优化

对生成的化合物的首要性质评估就是与靶点的结合构象及亲和力。基于结构的 CADD 方法(如分子对接)的通量较低,可形象理解为“漏斗形态”的单轮筛选。

与“活性-可合成性评估-成药性优化”线性串联的评估方式不同,基于 AI 的新流程在分子生成阶段就引入多目标优化,在分子对接的基础上,亦将构效关系、蛋白-小分子相互作用等多项筛选条件同时纳入,进行活性筛选的同时完成上述性质的评估,不仅大大提升效率,更在于达到指导生成兼顾多重属性、活性更优化合物的目的。下图分子库可视化比对结果显示,经历两轮“生成-筛选-优化”过程后,分子库对接打分可整体提高约 20%,且骨架多样性得到保留;意味着同样的资源消耗下,更快更远地探索到理想的化学空间。

(左)为两轮工作流程后,全部生成分子的对接打分分布;
(右)筛选后分子的对接打分分布


成药性质评估

对化合物的成药性质评估及多任务优化是药物设计时一大难点。相较于某些性质的决定因素单一、因素间关联性低,且具有明确的机制,如化合物水溶性、脂水分配系数、hERG 毒性等,AI 方法更适用于高维度变量且机制不明确的性质预测,且更具效率优势。

化合物潜在 hERG 毒性预测可转换为
与 hERG 受体结合能力及效应的评估测算问题

化合物在体内复杂的 ADME/T 规律往往是众多影响因素作用后的结果,如多种类型细胞参与、众多酶代谢转化、转运蛋白介导等等,基于数据及 AI 的模型算法,可跨越对中间“机理步骤”的显性模拟,直接构建“输入-输出”间的关联关系。


平台整合,让 AI 发挥最大效力

结合药物研发的具体应用将 AI 算法模型进行整合,使得研发流程更加顺畅、标准,结果也更可靠。比如

● 药效团信息的提取、编辑、整合到指导新的分子生成,同一套体系下工作效率更高;
● 对分子库特征描述的储存和调用,使结果和标准保持一致,计算效率提升;
● 运用增量学习策略完成 ADMET 模型更新预测,并给出不确定性评价,能更好地利用、解读模型结果,并做到提高具体案例的预测准确率。

我们期待随着 AI 技术不断落地于药物研发项目,为领域带来飞跃与革新。






推荐阅读


点击这里,观看直播!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存