查看原文
其他

Pharma.AI 平台系列 | 从 iPANDA算法到AI靶点识别平台PandaOmics

InsilicoMedicine 英矽智能 2023-08-18

“对研究对象进行分组,分析多组学数据、通路激活状态和基因表达,最终确定4个可能调控肿瘤发生的基因位点…” 这是2021年8月,年仅17岁的高中学生Andrea Olsen在国际权威大会上分享的研究成果。而帮助Andrea跨越专业知识壁垒,在生物制药领域取得研究成果的,是一款由人工智能驱动的靶点发现平台——PandaOmics™。



PandaOmics™ 由英矽智能自2014年着手开发,集成30余种深度学习算法,利用AI技术“从已知推测未知”的特点,对1975年至今的海量科学研究产生的数据进行分析,辅助靶点发现决策。截至目前,该平台已成功赋能包括:肿瘤、纤维化、肌萎缩侧索硬化症 (ALS) 和 新冠肺炎等多种疾病的靶点发现,并被诸多学术机构和生物医药公司纳入到靶点识别的工具库中。






历时7年,

PandaOmics™是如何搭建起来的?


在靶点发现过程中,信号通路分析是效果显著的方法之一,但在海量的数据和干扰影响下,分析信号通路、找到有潜力的靶点无异于大海捞针。此前,有一些科研团队尝试用计算机辅助方法分析数据从而找到新颖靶点,但这些分析方法大多稳定性较差且难成体系。


2016年11月,顶级学术期刊子刊Nature Communications发布题为“以iPANDA算法作为生物靶点发现方法”的论文,带来了新的解决方案——通过对比不同群体的表型组学数据,iPANDA算法对多通路的激活状态进行分析,再对研究基因进行筛选、分组和拓扑计算,最终得出重点信号通路的激活情况,辅助靶点发现。提出iPANDA算法为AI靶点发现迈出了第一步。作为辅助通路分析的算法,iPANDA提供的信息依然相对局限,科研团队认为还需要更多的验证和数据补充。


iPANDA算法工作流程,图源:https://www.nature.com/articles/ncomms13427/


2017年12月,在iPANDA算法诞生两年后,英矽智能的科研团队以“发现胚胎-胎儿转化靶点COX7A1”登上专注肿瘤相关研究的同行评议期刊Oncotarget,这是该领域第一篇论文,也是AI靶点发现从理论走向现实的重要佐证。


在该研究中,科研团队首先比较了6种算法在组学数据分析和潜在靶点定位方面的准确性和稳定性。科学家们发现,相比K-近邻算法(kNN)、基于PCA降维的逻辑回归算法(LR)、支持向量机(SVM)、梯度提升机(GBM)等候选算法,多分类深度神经网络(DNN)具有更高的准确性和稳定性。接着进一步优化DNN算法,使之升级到由20个DNN的集成算法。然后在iPANDA和集成DNN的辅助下,研究人员成功定位到潜在抗肿瘤靶点COX7A1。该研究结果在肺部、肝脏、肾脏、乳腺、皮肤等多部位的癌细胞以及小鼠模型中得到验证。






从论文到实践,

PandaOmics在真实世界中的表现


此后,PandaOmics平台不断接受检验、迭代优化,在进一步延伸数据分析范围、提升靶点分析能力的同时,促进更多学术创新。2018 年,iPANDA辅助英矽智能研发团队,对双免疫检查点靶向抗体-配体陷阱进行识别,为癌症免疫治疗提供新的思路,再登Nature Communications。2019 年,iPANDA 又对胆囊癌相关的通路异常激活进行分析,定位到潜在靶点PIM1,并于同年与知名高校达成合作。


PandaOmics 平台有效性已经获得多篇同行评议论文验证

扫描二维码查看部分重点文献全文


2020年,集成了iPANDA在内30多种算法的PandaOmics™靶点识别平台,以SaaS软件的形式正式上线。随后两年间,面对更多的外部用户和真实世界数据,PandaOmics™平台迎来了前所未有的挑战和进步,不仅根据客户反馈完成了多次平台优化,还融合了包括由google提出的具有Attention机制的transformers模型等新兴技术,并持续维护和调整自身算法库和数据库,高效完成数据分析、趋势预测、可视化呈现等多种工作。


2022年3月,通过对多种年龄相关疾病的分析,PandaOmics™发现145个潜在衰老进程和年龄相关疾病的双效靶点,并对其作用机制、药物安全性进行分析,相应的研究成果被采纳为当月权威期刊Aging的封面文章。该研究耗时仅两个月,充分证明PandaOmics™缩短药物研发周期、降本增效的能力。







以人工智能

赋能人类高质量健康生活


从iPanda诞生到现在,PandaOmics历经7年发展,经历了理论、验证、迭代、实践多个阶段,已经与辉瑞、复星医药、哈佛大学、约翰霍普金斯大学、妙佑诊所、芝加哥大学等机构达成合作,成长为多功能多维度下由人工智能驱动的靶点发现平台,囊括超1000万份组学数据样本、超34.2万项临床试验数据、43.3万个分子的相互作用机制,涵盖转录组学、基因组学、表观基因组学、蛋白质组学和单细胞数据,包含超20种优选AI数据模型,有能力根据输入数据生成动态结果。


PandaOmics平台里程碑


但AI赋能药物研发及人类健康生活的努力并未止步于此。2022年11月14日,英矽智能内部AI团队将携AI与制药领域专家,全球发布PandaOmics平台3.0版本。同时发布的包括小分子设计与生成平台Chemistry42 2.0版本,及临床试验方案结果预测引擎inClinico 1.0版本。扫描下方二维码即可免费报名参与发布会,我们诚邀您一同见证AI制药行业的创新变革,以人工智能赋能人类高质量健康生活。



参考文献

[1] Ozerov, I., Lezhnina, K., Izumchenko, E. et al. In silico Pathway Activation Network Decomposition Analysis (iPANDA) as a method for biomarker development. Nat Commun 7, 13427 (2016). https://doi.org/10.1038/ncomms13427

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存