过去几十年间,全球范围内的老年人口比例急剧上升。据科学数字出版商 Our World in Data 公开统计,当前人类的预期寿命业已显著增长,超过两个世纪前人类寿命的两倍。老龄化问题不仅带来了与医疗保健相关的巨大挑战,与之相关的大数据也呈现出了爆炸式增长。出于对大数据环境的敏锐嗅觉,部分先进的 AI 医疗技术公司已经抢先试水,尝试利用广泛的生物学数据和计算技术来促进对于衰老过程及其疾病的作用和理解。在 3 月初刚刚将全球首个依靠 AI 技术发现特发性肺纤维化(IPF)疾病新靶点产品推进临床 I 期之后,以人工智能驱动的新药研发公司 Insilico Medicine(以下简称 “Insilico”)又有新动作。3 月 29 日,来自 Insilico 的研究团队于 Aging 杂志发表论文,介绍了该公司基于自主研发的生物靶点发现引擎 PandaOmics,成功建立起一种独特的方法来识别潜在的两用靶点,其将用于抗衰老和与年龄相关疾病的研究。“基于 Insilico 快速并且有效的抗衰老研究,我们将致力于在该领域中开展药物研发工作。与此同时,对于衰老和相关疾病的机器学习工作将反哺于 AI 技术,我们也希望凭此支持更多的制药公司从事老龄化研究工作。”该公司的首席执行官 Alex Zhavoronkov 博士告诉生辉。
寻找同时影响衰老和老龄化疾病的双重靶点
广义上看,衰老可初步定义为渐进的退化过程,它涉及生理功能的衰退和随着时间的推移而增加的死亡风险。然而迄今为止,科学界对于衰老的机制、原理等诸多问题依然争论不休。可以说,关于衰老科学的研究仍处于初期阶段。2013 年,发表在 Cell 上的一篇文章列举了目前已知的九大衰老机制,包括:基因组不稳定、表观遗传改变、端粒磨损、蛋白质稳态丧失、新陈代谢失调、线粒体功能障碍、细胞衰老、干细胞耗竭、细胞之间的通讯异常。此前,已有部分研究人员提出,以复杂性著称的衰老科学背后涉及数量庞大并相互交错的基因组、表型数据和信号通路。显而易见的是,许多疾病是由于多种问题共同导致的,这为研究工作带来了不小的挑战。现在,Insilico 的研究团队使用由 AI 驱动的 PandaOmics 平台,对多个靶点进行识别并按照相关性排序,提出了一系列有潜力开展药物发现的新型抗衰老靶点。除此之外,该团队还提交了一份经典靶点列表,其将有希望在衰老疾病中开展药物再利用研究。研究团队发现,在选择药物靶点并设计药物时,使用单一的靶向药物甚至是一种组合疗法来治疗一类大的疾病群体是非常困难的,这是由于许多疾病根本上存在异质性。特别是在诸如心血管疾病、糖尿病和神经退行性疾病等年龄相关疾病中,年龄是推动疾病进展不可排除的因素之一。此前,相当比例的抗衰老药物在临床试验阶段折戟沉沙。研究团队认为,靶点研究不充分、入组患者年龄选择不恰当是导致该结果的部分原因。因为对于不同年龄段的患者来说,各靶点的重要性将随之变化。“对于当前阶段的衰老研究,我们更关注于将年龄和患者特征相结合的高质量多组学数据集,这将有助于改进年龄相关疾病的临床试验设计。目前,大多数治疗靶点都没有考虑到患者的年龄,并且在相对年轻的人群中进行测试(临床 I 期的平均年龄为 24 岁),这成为了导致众多临床 II 期试验失败的原因之一。”Insilico 香港区负责人潘颖博士介绍道。因此,Alex 提出一种设想:必须寻找同时影响衰老和老龄化疾病的双重靶点,即使该靶点对于某一特定患者来说不是最重要的,但其药物仍将使患者受益。在本次研究中,为了识别出潜在的衰老和老龄化相关疾病相关的双重靶点,研究团队使用 PandaOmics 发现引擎对 14 种年龄相关疾病(AADs)和 19 种非年龄相关疾病(NAADs)进行靶点识别。通过将来自 AADs 的前 100 位高相关致病靶点与 NAADs 靶点进行比较,从而分别定义老龄化相关疾病靶点和共同靶点。经评估,当前共有 145 个基因被认为是潜在的衰老相关靶点,并被映射到相应的衰老列表中。其中包括 69 个具有高可信度的靶点,48 个具有高或中等成药性的新靶点,以及 28 个具有中等成药性的高度新颖靶点。图丨与各衰老特征相关的靶点示意图(来源:Aging)此外,该算法的评估结果中包括了多个已知的著名衰老相关基因。例如哺乳动物雷帕霉素靶蛋白(mTOR)、类胰岛素生长因子(IGF)和 sirtuin 蛋白家族成员,这些结果为该衰老靶点鉴定方法的有效性提供了有力支持。另一方面,其结果进一步显示:除了九个经典的衰老机制之外,炎症、细胞外基质僵硬、反转录转座子激活过程等同样对于衰老产生了密切影响。其中,慢性炎症被认为与多种老龄化疾病高度相关,这一点也与科学界中 “炎症是衰老过程的内在和主要组成部分” 的观点相一致。不过,本次研究同时也指出了当前评估方法的局限性:部分疾病可用数据集和原理性文献的匮乏成为了主要的限制因素,这可能将影响最终的分析结果。然而,通过使用新颖的计算方法对于大数据进行分析,从而提供对衰老过程的初步解读,或将成为快速实现抗衰老和治疗老龄化疾病的有效途径之一。在论文中,Insilico 已经披露了一份潜在的抗衰老双重靶点清单,可为药物研发提供参考。衰老研究或将有助于开发更好的生物学 AI 工具
不可否认,大量数据的产生推动着众多科学走入了人工智能时代。近年来,机器学习技术在靶点发现领域中已经迅速普及。成立于 2014 年的 Insilico 可说是 AI 药物研发领域中的头部玩家。此前,该公司旗下的 ISM001-055 化合物分子从靶点发现、确定 PCC(临床前候选化合物)再到进入临床 0 期阶段,仅历时 18+9 个月。而本次研究从构思到论文提交,整个过程仅耗费 2 个月即完成,清楚地展示了其 AI 技术平台的研发效率和能力。通过建立起端到端的人工智能药物发现平台 Pharma.AI,Insilico 长期致力于加速解决来自化学、生物学和数字医学等各领域的复杂挑战。该平台中包括 PandaOmics、Chemistry42 和 InClinico 三个人工智能引擎,让 AI 技术全面覆盖包括新靶点识别、新型分子的生成以及临床试验结果预测的完整研发链条。迄今为止,Insilico 的综合组学数据库中已汇集了大量已发表的生物学数据,涵盖 1,500 多种疾病和 10,000 种疾病亚型。涉及来自超过千万样本的约 1.9 万亿个数据点,包括微阵列、RNA 测序、蛋白质组和甲基化组等各个数据类型。在本次研究中,针对于 33 个疾病研究对象共涉及 192 个数据集,其中包含 2,384 个真实病例和 1,532 个对照样本。近年以来,抗衰老科学正在蓬勃发展,越来越多的生物制药公司开始关注衰老研究。潘颖表示,“显而易见的是,衰老是众多疾病的主要驱动因素。尽管其潜在的分子机制仍然是争论的主题,但众多关键通路和过程已被证实与衰老过程有关。”目前,已有众多制药公司正在开展衰老研究并研发新药,先后涌现了Calico、Altos Labs 和 Genentech 等明星企业。
“与之相比,Insilico 的工作已经进入了下个阶段,即建立起从零开始的研发能力,而并不只是继续已有的抗衰老研究。通过使用纵向生物数据,其在深度神经网络(DNN)中建立起对于人类生物学的基本认知,并对疾病数据重新开展训练。”Alex 介绍道,“另一方面,通过使用纵向数据进行验证工作将补充 AI 工具的逻辑性,从该角度出发,对于衰老的研究也将有助于开发更好的生物学 AI 工具。”
老年科学的既定目标不仅是延长寿命,而且是延长健康寿命,即所谓的 “健康老龄化”。现阶段,Insilico 将首先围绕多种与年龄相关的疾病靶点设计药物,并将致力于为广大患者带来抗衰老益处,即使他们可能并未罹患特定的适应症。对此,潘颖强调:“Insilico 将优先考虑来自于疾病治疗方向的需求,并将遵循标准的临床试验程序开展研发工作。在此基础之上,使药物具备广泛的抗衰老益处也会是研发团队追逐的目标。”当前阶段,除了数据量方面的限制可能影响 AI 技术准确性和效率之外,临床转化、更长的试验周期等依然是抗衰老领域绕不过去的难题。但在此之前,更有效率的靶点预测工具或将帮助研究人员规避早期的错误选择,从而明显减少发现疾病治疗所需的成本和时间。基于当前的研究进展,AI 技术为加速抗衰老疗法进展提供了可能,虽然尚不能确定其将于何时进入产业化,但却将为其他领域的更多探索工作指明方向。- https://doi.org/10.18632/aging.203960
- https://www.fiercebiotech.com/medtech/insilico-medicines-ai-zeroes-new-drug-targets-aging-age-related-diseases
- https://www.nature.com/articles/s43587-021-00078-8