每逢AI火,AI新药必被追问:哪些已成现实,哪些仍是幻觉?
过去一年,动脉新医药密切关注AI+新药领域动态。我们曾访谈过多位对AI+新药心怀热忱的创业者、科学家,他们大多认为只要有足够的信心和耐心,再建立一个良好和共享生态,制药界ChatGPT就在不远的将来。当然,在各个行业大会和小型交流讨论中也能听到不同的声音。有创业者指明,当前许多信息化的工作被误认为是数字化。也有CADD专家质疑,当下AI的作用被高估了,投入太多,产出太少。
尽管AI在文字生产和图像识别等领域的实践已受到广泛认可,但在药物发现方面的进展却很难量化验证。AIDD能做什么CADD做不到的事?应用AI技术设计的分子活性如何,成药率更高吗?针对这些问题,业内一直争议不断。
一个共识是,AI+新药前景可期,但当下仍行走在迷雾中。这时,无论是局内人还是旁观者,都更需要真诚而鲜明的观点,来辨别现实与幻觉。
剑桥大学、阿斯利康和欧洲生物信息研究所的几位研究人员2021年在《Drug Discovery Today》上发布一篇文章,分为上下两篇,提出了AIDD目前存在的几个真问题。
文章标题就指出了一个一直困扰行业的问题,AI用于药物开发,到底哪些是现实,哪些是虚幻的期待?AI如何发挥作用,为什么现在还远没有达到我们的预期?
动脉新医药对该文的几个重要观点进行了编译,希望能为关注AI+新药领域的从业者提供一些认知上的启发。
一问:站在CADD看AIDD,
对新技术的预期该设多高?
CADD 至少有40年的历史。1981年,《财富》杂志宣布它是“下一次工业革命”的开始,药物将在计算机中进行设计。对于计算科学的前景预测,《新英格兰医学杂志》最为大胆,其曾在1970年宣称,计算科学在医生决策系统中的应用,甚至可能会取代医生的作用。
但是,直到2000年“生物技术泡沫”崩溃前的几年中,人们才越来越关注如何用计算方法进行药物发现。
如今,经过20多年的发展,取代医生当然没有发生,对CADD的期望也并非所有都已实现,但今天,我们可以说,CADD已经成为药物开发的基本方法。
CADD的故事证明,站在某个时间点去预测当下技术发展的潜力,并不一定现实可靠。
2007年,参与CADD发展初期的John Van Drie预测,药物开发技术将在未来20年内实现七个主要发展:
1.计算热力学将发展成熟;
2.高亲和力配体将可以成药;
3.将出现全新的药物靶点;
4.新的药效分子机制将出现(例如自组装药物);
5.与单一靶点抑制剂不同,更多会模拟整体的信号传导通路,从而选择更好的靶点;
6.未来CADD将作为基础工具普及到每一位药物化学家;
7.虚拟筛选将广泛应用。
上述大部分预测已成为现实。然而,我们发现,在化学上的计算处理要比生物学上的进展快很多。决定配体与受体亲和力的热力学基本原理,很多都已经较为成熟(尽管在实操中化学结构的灵活性处理仍有难度)。但生物学明显更复杂,受体构象变化、平衡和偏向信号等已经很难理解,对于更下游的问题就更加困难,如基因表达或蛋白质修饰的变化,尤其是当涉及到模拟空间和时间变化时。
这仍然是当前计算药物发现领域的致命弱点,在AI应用时也带来了问题。我们能够很好地描述化学,并有大量的替代分析数据可用于建模,这些数据一直是AI领域的关键焦点。然而,药物作用于生物系统时,确定一组模型参数的范围要困难得多,因此我们也面临着更多的不确定性,即到底是哪些实验数据体现了与有效性或安全性相关的关键信息。
在我们提高对化学系统的理解的同时,会更加倾向于主要关注更大数量、而不是更高质量(和相关性)的数据。例如,组合化学在80年代的发展和高通量筛选在90年代的出现,在当时都受到盛赞,这些技术无疑可以让我们产生“更多”的数据,并且在靶点明确的情况下大幅提升筛选效率。然而,这些发展都没有颠覆新药开发的现状,至少在药物获批数量上没有出现激增。
二问:评估AI在药物开发中的作用,
成功率、速度和成本哪项指标更重要?
当然,评估AI在新药发现中的作用,最重要的是先评估量化指标。
首先需要模拟几个变量的实际作用效果。假设三种情况,分别为速度提升20%、成本降低20%和药物研发的各阶段成功率提升20%。在这个模拟中,假设专利期为20年、在临床Ⅰ期开始时提交专利申请。以此来计算决策的速度、成本和成功率的变化对整体项目回报的影响。
结果显示,提高各阶段成功率对项目整体价值影响最大,这种影响在临床II 期最为明显。这是由于临床阶段的成功率相对较低,持续时间较长,成本较高。提升临床阶段的成功率减少了将药物推向市场所需的昂贵临床试验的数量,失败数量的减少比更快或更多的试错次数更重要。
理论上AI可以实现上述所有目标,做更快、更便宜、更优质的决策,但实际上“质量”常常被忽略。结合上述量化结果,我们可以看到,相比更快、更便宜来说,更优质的分子对药物发现方案的成功影响最大。但目前AI在药物发现中的主要注意力似乎放在了速度更快和成本更低上,而不是决策的质量。
正因如此,人们迫切希望证明一个新系统能够成功地实现其目标,但这往往会使业界急于去验证那些无关紧要的指标,而非决策质量本身。这导致了人们关注一些微不足道的进展,而不是去证明其是否真正的拓宽了传统研发方法的边界。
业内大多执着于解决分子设计及优化的效率问题,但只有基于对药物作用机制(MOA)和疾病机制的理解才能使AI更好地实现其功能:1.选择更优质的临床候选化合物;2.更好的靶点验证,以减少因有效性而导致的临床失败、尤其是在临床Ⅱ/Ⅲ期;3.更好的患者选择;4.更好的临床试验执行。
对于AI+新药行业来说,我们如何定义研发成功、应该关注哪些指标,与我们如何建立模型同等重要。
三问:AI用于药物发现还是配体发现?
尽管我们已经知道,AI需要做出高质量的决策,但由于替代数据的特性,近几十年来在高通量系统中生成的数据无法充分支持AI应用。产生如此大规模的高通量替代数据,部分是由于其确实有实际的相关性,但在某种程度上也由低成本和高速度的行业逻辑驱动。
实操中,我们所拥有的许多替代数据为决策提供的价值极其有限,当前AI的应用仍停留在配体发现,而不是药物发现层面。
许多瞩目的进展都集中于AI药物发现中的化学层面,而忽略了对生物学的进一步理解,比如更大规模的对比、深度学习等方法的应用、矩阵分解、以及纳入细胞形态学等。这些领域的数据在很大程度上被进行过充分标记以进行数据挖掘,因此计算分析可以对预测配体-蛋白质的相互作用产生重大影响。
然而,我们需要确定特定作用机理与疾病之间的联系,才能使化合物在体内表现出所需的疗效。靶点识别领域已经活跃了许多年,采用了诸如全基因组测序、功能基因组学以及CRISPR编辑等手段,然而所发现靶点与疾病的关系并不如人们所希望的那样明确,从药物发现的角度来看也并不完全可行。进一步说,即使识别出引起疾病的特定基因或蛋白质,也不意味着可以通过小分子的靶向治疗来治愈疾病。
为了在药物发现中验证AI系统,我们需要转向更复杂的生物系统(和临床)。在计算层面,意味着在模型中需要包括更多与疗效和安全性相关的预测终点。当然,这可能需要生成新的数据,这些数据可能远比单个终点更加复杂、更难以优化。
写在最后
AI用于药物发现领域到底能起到多大的作用?本文给出的判断是:以当前生成和利用数据的方式,我们不太可能利用AI做出能提高药物发现成功率的更好的决策。虽然化学数据量以及有很多,也已经成功地用于配体设计和合成,但是还没有达到在药物发现整体中充分利用AI的程度。
同时,现在AI的应用缺乏对生物学的理解,基于化学数据训练出的AI模型,对药物在体内的有效性和安全性缺乏预测能力。因此,需要生成和利用更多生物学方面的数据,才能实现让更优质的候选化合物进入临床、更好地验证靶点、改善患者招募、并改进临床试验的执行方式等等。
结合下篇中阐述的药物发现领域中数据层面的具体困难,我们发现,AI需要的是格式可用、目的明确的数据。为了能够真正将化学和生物数据用于药物发现,比起技术产生数据,我们更应该关注的是从科学需求源头拉动产生数据。
事实上,身处AI+新药行业内的人能最先感受到这些局限性,也能最快展开动作。
这篇论文发布于2021年2月,站在两年后回看当时的犀利之问,会发现已经有了一定程度的突破:CytoReason在细胞水平上建立疾病模型,利用机器学习技术将遗传学、基因组学、蛋白质组学、医学文献结合起来,由此绘制了数百种细胞间免疫系统图谱;在中国,中科院计算所孵化的哲源科技采用与CytoReason相似的模式,针对特定疾病进行新靶点、靶点机制的发现,匹配具有临床疗效优势的适应症及最优适应患者人群,拓展药物上市后适应症。
可以预见的是,技术发展还会遇到源源不断的新问题。行业永远需要犀利的提问者,也需要勇于应对前沿问题的创新者。
*参考文献:
1.Bender A, Cortés-Ciriano I. Artificial intelligence in drug discovery: what is realistic, what are illusions? Part 1: Ways to make an impact, and why we are not there yet. Drug Discov Today. 2021 Feb;26(2):511-524. doi: 10.1016/j.drudis.2020.12.009. Epub 2020 Dec 17. PMID: 33346134.
2.Bender A, Cortes-Ciriano I. Artificial intelligence in drug discovery: what is realistic, what are illusions? Part 2: a discussion of chemical and biological data. Drug Discov Today. 2021 Apr;26(4):1040-1052. doi: 10.1016/j.drudis.2020.11.037. Epub 2021 Jan 27. PMID: 33508423; PMCID: PMC8132984.
*封面来源:123rf
如果您想对接动脉新医药报道的企业,请点击文末左下方“阅读原文”填写表单,我们的工作人员将征求企业意见后,尽快为您服务。
专题推荐
类器官与器官芯片 | CXO | iPSC | CGT核药 | 上游工具 | 多肽 | 外泌体 | NASH蛋白降解剂 | 合成生物学 | AI+新药VB思享会 | IPO-财报解读 | 新医药对话