查看原文
其他

Q&A|Pharma.AI平台全球发布,问题解答在此放送!

InsilicoMedicine 英矽智能 2023-08-18

2022年11月14日,英矽智能发布旗下Pharma.AI人工智能药物研发平台全球同步更新,包括全新靶点发现引擎PandaOmics、分子设计和生成平台Chemistry42以及临床试验结果预测平台InClinico。


发布会后,许多行业伙伴通过邮件、留言等方式提出关于Pharma.AI平台的专业性问题。在内部团队讨论之后,英矽智能谨对部分问题做出了答复,供读者参考。


点击视频查看发布会精彩回放


Q1

inClinico经历过数据有效性验证吗?

inClinico是经过验证的。从英矽智能成立以来,inClinico研发项目就在进行中,目前已经采用英矽智能独创的“时光机验证法”对其有效性进行了回顾性验证或者准回顾性验证。


具体来说,“时光机验证法”就是以某一个时间点为分界,将数据分为测试组和检验组。将该时间点前的数据输入AI引擎,得出预测结果,并与该时间点之后的真实数据对比,以检验预测准确度。


此外,英矽智能还通过与对冲基金、大型制药公司等机构的合作,对inClinico在公开信息、学术文献、临床试验解读等方面的性能进行了验证。相关结果显示,inClinico的预测准确率可以达到80%。其他方面的数据不方便透露,但inClinico预测效果肯定是高于基线水平的,这点毋庸置疑。


Q2

Pharma.AI平台是如何降低药物研发行业门槛的呢?是否有试用?

没错,英矽智能确实在致力于降低药物研发的门槛,让所有人都能参与到这个宏大的行业中来。举例来说,Pharma.AI平台中的PandaOmics目前已经赋能了癌症、纤维化、免疫等多个领域的靶点发现,助力了医疗药企、学术机构,甚至高中学生的研究项目。


访问公司官网上的Pharma.AI对应页面,即可申请试用。


Q3

作为预测临床试验结果的平台,inClinico包含多少临床试验数据?

整体而言,inClinico平台包括18万项临床试验相关数据,涵盖小分子、靶向小分子等多个领域,同时还有明确的调节机制,以此确保预测结果的准确性。


详细来说,进行回顾性时光机验证的时候,验证组数据包含的临床试验数据在1000项左右;在真实回顾性验证时,大概是100-300项左右。


Q4

PandaOmics平台是如何实现多组学数据分析的?

为满足多维度评估靶点发现的需求,PandaOmics平台集成20+算法模型、60+计算规则,利用公开可获取的文献资料和自有数据库,对基因数据、动态基因表达、代谢组学、表观遗传学特征、蛋白质相互作用等方面进行分析后,得出靶点综合评分,辅助靶点发现决策。


过去八年来,在外部反馈和药企合作和助力下,PandaOmics经历了真实数据和真实环境的考验,不断更新进步。另外,英矽智能正在搭建的机器人自动化实验室,也会和Pharma.AI线上平台打通,通过自有的样本分析、图像识别等能力继续丰富平台数据、强化平台性能。


Q5

制药行业最大的挑战是什么?是新颖分子发现,还是临床数据验证?

从根本而言,制药行业面临的困境或许是人类复杂的生物学机制机理。以人类目前的医疗科技水平,我们对许多疾病、药物、副作用的机制都还不能准确解读。正因如此,医疗行业的发展需要更多人的努力,英矽智能开放Pharma.AI人工智能药物研发平台的授权也正是这个原因。


Q6

inClinico有考虑到患者招募等非技术性的因素吗?

有的。在临床试验结果预测过程中,inClinico会纳入尽可能多的数据,其中包括一些偏主观的因素。举例来说,对某些中枢神经系统疾病来说,地理因素是很重要的,可能会影响到对照组的规模,进而影响临床试验成功率的预测。考虑到这一点,inClinico纳入了不同临床试验中心历史招募信息,并在此基础上做出分析和预测。


另外,战略规划变更等因素也会导致临床试验的失败或者中止,要对公司高层决策做出预测是很难的,但Pharma.AI平台会对靶点未来热度进行预测,通过推荐更有潜力的靶点,降低临床试验被中止的可能性。


目前,inClinico主要专注在II-III期临床试验结果的预测,尽量避免在患者招募数据缺失的情况下做出可靠性不足的预测。


Q7

Pharma.AI平台包含转化性临床前模型吗?比如肿瘤方面的?

Pharma.AI包含一系列肿瘤领域的模型,涵盖in vitro、临床前等领域,还有计算ADMET等性质的预测算法。也就是说,英矽智能自有的Pharma.AI平台已经具备了一定的转化医学能力,可以对已知的分子结构进行计算,得出ADMET等药企可能不会披露的性质,赋能临床试验结果预测、辅助后期研发。


更重要的是,inClinico不但可以对已经开展的临床试验进行结果预测,还能在药物研发的早期,通过特定维度的评分,优化管线开发决策。举例来说,在平台助力下,用户可以优先开发有适应症扩展潜力的靶点,提升抗风险能力。


Q8

血脑屏障是AI制药面临的重大挑战之一。Pharma.AI平台在进行分子设计和生成的时候会考虑到这个问题吗?

当然会有考虑。Pharma.AI中的小分子设计和生成引擎Chemistry42已经预先设置好相关参数,有关的描述符设置也不止一个。只要明确需求,AI就能按照要求生成具有/不具有穿透血脑屏障能力的分子。


未来,Chemistry42还会迎来更多更新,进一步拓展分子生成能力,满足用户需求。


Q9

Pharma.AI平台未来会考虑纳入非托管代码和分散式算法吗?

现在已经有采用了。目前,相关算法已经作为两个模型被纳入Pharma.AI平台了,主要用于微结构的生成和设计。


Q10

PandaOmics采用的数据来源是哪里?预测结果可靠吗?


整体来说,PandaOmics采用的数据是直接来源于公开获取的文献资料、科研基金、临床试验等数据的。更重要的是,英矽智能的内部专业团队还会对相关数据进行清洗、标注和整理,由此形成关于靶点、疾病、适应症、相关机制、信号通路、代谢通路等众多信息的数据库,赋能更可靠的靶点发现过程。


另外,PandaOmics预测结果会经过AI自动验证、人工验证等多重检验,由此保证算法正常运转、结果切实可靠。


Q11

PandaOmics靶点发现方法如何与AI技术、生信方法相结合?

在AI技术方面,我们使用了NLP将文献、专利、临床报道中的疾病、基因、突变、药物信息抓取并整理成了一个knowledge graph。再利用多个图网络模型,挖掘新的基因和疾病的联系。


在生信方法方面,PandaOmics的30+算法中,有13个基于组学数据的算法,它们会针对于每个靶点打分,基因表达的变化是其中一个分数,这个是利用传统生信方法得出的。我们还利用了GWAS、热点突变这些数据,也是通过传统生信方法得出的,我们最后会根据传统生信分析和知识图谱的分析给出综合的打分。 


Q12

小分子生成算法能否实现denovo生成(只针对具体靶点结构,不基于特定小分子骨架)

在Chemistry42中,集成了30多种人工智能算法模型,可以基于小分子2D或3D的结构进行分子生成,也可以针对靶点/蛋白晶体结构,实现基于结构的分子生成。如果所研究的靶点没有晶体结构,也可以尝试基于Alphafold预测的蛋白结构进行分子生成。


关于英矽智能

英矽智能是一家由端到端人工智能(AI)驱动的药物研发公司,通过下一代人工智能系统连接生物学、生成化学和临床试验分析,利用深度生成模型、强化学习、转换模型等现代机器学习技术,构建强大且高效的人工智能药物研发平台,识别全新靶点并生成具有特定属性分子结构的候选药物。英矽智能聚焦癌症、纤维化、免疫、中枢神经系统疾病、衰老相关疾病等未被满足医疗需求领域,推进并加速创新药物研发。更多信息,请访问网站: www.insilico.com

商务合作,请联系 bd@insilico.ai

媒体垂询,请联系 pr@insilico.ai

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存