自从7月份 DeepMind 公司宣布,AlphaFold 可以预测出超过 100 万个物种的2.14 亿个蛋白质结构,该消息如同重磅炸弹,震荡了整个生物制药圈。随之而来的是更多专家学者关于人工智能(简称AI)如何在大分子药物发现中发挥潜力的评论:Nature 近期的一篇评论文章指出,为了充分利用人工智能,数据和软件必须自由共享,计算、理论和实验研究人员必须紧密合作;著名生物医药行业科学家 Derek Lowe 也在 Chemistry World 发表了评论,他认为媒体夸大了 AI 在药物发现领域能发挥的作用。到底 AI 在抗体药研发过程中有哪些应用场景?Dr.X 与您共同探讨 AI 与创新抗体药物研发的未来趋势,邀请您参加有奖调研活动。 Dr. X 梳理了近期关于 AI 用于药物发现的研究报道,为大家总结了 AI 在抗体药研发方面已实现的四大应用场景如下: ●AI 用于抗体结构设计● AI 用于纳米抗体库的设计● AI 用于先导抗体的优化● AI 用于抗原抗体复合物结构解析 AI用于抗体结构设计 结构决定功能,大量的抗体发现实验和抗体工程化改造都依赖于准确的抗体结构,而抗体结构中最为关键的部分是活性位点和连接点的设计。Eguchi 等1基于抗体结构数据 AbDb 训练得到 Ig-VAE 模型,该模型可以同时探测抗体的扭转和距离信息,得到高精度的抗体数据库,从而产生新型且结构合理的抗体骨架。该模型的有效性在设计具特定表位的 SARS-CoV2-RBD 抗体方面得到了充分的验证。
Ig-VAE模型训练示意图¹
AI用于纳米抗体库的设计
候选抗体库的质量关系到抗体发现的质量,现有 de novo 生成蛋白大多基于多重序列比对(MSA),但对于CDR区域可变性极高的抗体来说,MSA 生成的库鲁棒性不够高。Shin 等2基于公开的羊驼纳米抗体数据库,训练得到一个基于扩张卷积神经网络的生成模型。从结果看,SeqDesign 设计的纳米抗体库与天然纳米抗体相比,有相似的生化性质,但具备更高的多样性。在35个蛋白数据集上,SeqDesign 与基于 MSA 方法相比,表现出更好的鲁棒性。该研究表明,AI 可以根据不同的需求,设计抗体指定区域的抗体序列,如指定CDR3或全部CDR,从而达到精准合成的目的。 生物学序列自回归模型学习基因型和表型图谱,用于序列预测和设计² AI用于先导抗体的优化 目前抗体人源化常用 CDR 移植加随机突变的方式实现,高度依赖专家经验在维持原 CDR 构象和人源化程度之间作平衡,而且经常面临抗体亲和力降低的问题。Prihoda 等3通过对 OAS 公开数据集中的人源抗体序列进行学习,得到自动化人源改造的AI模型,并在25对公开已知的人源化抗体序列中得到了验证。在此基础之上,Mason 等4尝试在进行抗体工程化改造的同时,通过对算法进行多目标优化,以实现抗体亲和力的保持或改善。研究结果显示,在保证 100%(30/30) 结合的基础上,扩充了两个数量级的可开发性良好的备选优化抗体分子。由此可见,AI技术可以对先导抗体进行目的性优化,并且扩大了先导抗体的数量,在抗体发现早期提供更多筛选的可能性。 人抗体胚胎基因与OAS库的多样性对比³ AI用于抗原抗体复合物结构解析 众所周知,蛋白数据库(PDB)包含了成千上万条抗体重链和轻链的信息。然而,晶体学的复杂性使得研究人员无法完全依靠蛋白数据库进行药物发现研究,并且在大量的药物发现研究过程中,对于大分子药物的结构解析是非常有必要的。Lozzo Y5 等结合冷冻电镜结构解析、计算机建模和分子动力学模拟,设计了一套蛋白复合物结构解析流程,仅花费数天到数周即可获得冷冻电镜抗原-抗体复合物结构。在近两年的38个案例中,该流程的模拟成功率接近100%,并且可以支撑下游MoA 研究、可开发性改造、结合表位研究、亲和力改造等工作。 四个抗原抗体结构解析案例⁵ 从上述的四大应用场景看,AI 在抗体药物筛选和优化方面已经取得了一定的研究进展,但是对于下游的基因表达、蛋白质修饰的变化以及在长距离蛋白序列所引起的构象变化等方面,相信 AI 还能够发挥更大的作用。 参考文献1. Eguchi et al, PLOS Comp Bio 2022; 18(6): e1010271.2. Shin et al, Nat Commun 2021;12(1):1–11.3. Prihoda et al, MAbs, 2022; 14(1): e2020203.4. Mason et al, Nat Biomed Eng. 2021;5(6):600–12.5. Lozzo Y., et al. Antibody Therapeutics, (2021). 晶泰科技是一家怎样的企业? 欢迎点击下面这条视频,并关注晶泰科技视频号,随时掌握 AI 药物研究领域的前沿技术与最新动向