AI药物研发公司Insilico Medicine的理念、技术与特点
药物研发困难重重。
对此,高举AI大旗的Insilico Medicine如何解读,如何行动?
漫漫药物研发路
这一过程涉及疾病假说的确认、疾病或病理关键靶点的发现和验证、苗头化合物(hits)和先导化合物(leads)的筛选测试、先导化合物关键参数(药代动力学性质、安全性、生物利用度等)的同步优化、动物试验上活性和安全性的证实、被监管机构批准后的临床试验等。
漫漫药物研发路(图片来自网络)
在过去数十年的时间里,制药行业已经将药物研发的方方面面反复“拆解”、“组装”,从头到尾研究和实践了无数次,然而,药物研发的生产率仍然非常低下,失败率高达90%。
低效的原因到底在哪里?对于这一问题,业界已有很多解读,不少制药公司和机构也从不同的角度进行了持续的探索。
值得一提的是,近几年的时间里,AI在制药行业的应用颇受关注。
接下来,本文将对AI药物研发公司Insilico Medicine提高药物研发效率的理念、思路和活动进行分析。
Insilico认为研发阶段之间的脱节是关键原因
Insilico认为,生物系统的巨大复杂性和我们对自然运作方式的有限理解,是药物研发低效的主要原因。在此之外,最关键的原因是不同药物研发阶段之间的显著脱节:
药物的生物学研究是由一家公司完成的,而化学研究则是由另一个部门甚至是另一家公司主导进行的,随后的临床研究又是由另一个部门或机构进行的。这些阶段的过渡,例如从靶点验证到苗头化合物发现的过渡,有可能是埋葬许多绝妙想法、突破和巨额投资的坟墓。
专注于药物研发过程的某些特定阶段,是大多AI驱动的初创公司的通常做法。然而,Insilico认为,只有将AI用于联系药物研发各个阶段,并搭建一个从假说到临床前和临床阶段的一体化的系统,才能实现真正的颠覆性转变。
Insilico的AI药物研发一体化系统
Insilico布局了三个关键抓手
到目前为止,Insilico选择自建三个关键模块:用于靶点发现的PandaOmics,用于分子生成的Chemistry42、用于临床试验设计和预测的InClinico。
PandaOmics。
从2015年起,Insilico建立了一百多个不同的模型,这些模型使用不同的方法进行靶点发现,并结合了最佳实践以及已有的知识和经验。
PandaOmics可以用来分析组学(Omics)数据,也可以用来分析通路数据(采用一种名为iPanda的专利通路分析方法来推断通路激活或抑制),结合对整个文本数据池的分析,提出药物靶点假设,并对靶点进行评估。
Chemistry42。
Chemistry42是一款用于药物设计的自动化机器学习平台,能够于1周内发现全新的类似先导化合物的分子。该模块包括生成引擎和评分引擎,可为任何可用的目标结构或小分子配体设计新的分子,测试新骨架的性能,优化结合亲和性,并借助化学复杂性、人工合成可及性、代谢稳定性等方面的评价规则,来引导分子生成。
每一种新生成的分子都会被标注属性(如物理化学参数、结合分数、与药物相似的特征),并映射到客户的药物数据库中,以获取相似性和新颖性方面的信息。
InClinico。
为了提高大型制药公司对AI药物发现范式的信任度,AI药物研发公司最好能自己将AI系统发现的候选药物带入临床。
在临床前和临床阶段,InClinico利用了有关靶点、疾病、临床试验甚至参与研究的科学家的大量数据。Insilico认为,前瞻性验证是预测临床试验结果的最佳方式。
相对于PandaOmics和Chemistry42,Insilico对InClinico的介绍并不多。
创始人Alex Zhavoronkov
以技术研究和专利构筑壁垒
Insilico关于靶点发现的研究论文:
Insilico关于新型分子生成的研究论文:
Espacenet中检索到的Insilico的专利数据:
通过开放合作来完善AI药物研发系统
Arctoris从事实验室自动化和机器人技术的开发。Arctoris构建的云实验室,可以每周7天、每天24小时、远程执行实验计划,生成完全可复制的数据,包括完整的元数据捕获。
外界以为我们缺乏数据,事实上我们并不缺乏数据,问题在于验证结果的速度。
-----Insilico创始人Alex Zhavoronkov
肺纤维化研究是概念验证研究的里程碑事件
该新型候选药物的I期临床试验计划于2021年12月进行。
新靶点是由PandaOmics 生成的。以靶点作为基础,Insilico利用Chemistry42设计了一类新型的小分子抑制剂。
整个研发过程,从作出疾病假设到提供临床前候选药物,只用了不到18个月,只花费了约为200万美元的经费,研发成本相当于类似项目的十分之一。
提高速度和降低成本的道路并非一帆风顺。
2015年,Insilico开始了生成式对抗网络(GAN)的早期探索性实验。2016年6月,发表了对抗式自编码器(AAE)生成新分子的研究论文。后来对基于GAN的AI药物设计平台进行了一些改进和新功能设计,并申请了专利。
2017年,Insilico建立了多个工作GAN模型,包括指纹druGAN、SMILES的ORGAN、各种带有强化学习和LSTM的循环神经网络(RNN)架构、敏捷时间卷积网络(ACTN)和强化对抗神经计算机(RANC)。2018年,Insilico在构建和验证一个强大的深度生成模型"生成式张量强化学习" (GENTRL)方面取得了进展。
与制药公司的合作
机器人技术未来前景广阔
----------- End -----------
2020年AI + 药物研发全景概述:(五) 2018-2020的主要突破性事件
2020年AI + 药物研发全景概述:(四) 制药公司与AI的合作
2020年AI + 药物研发全景概述:(三) 投资机构Top50和市场时间线
2020年AI + 药物研发全景概述:(二) AI如何应对制药行业的效率挑战
2020年AI + 药物研发全景概述:(一) 概要
FDA发布RWE用于支持医疗器械监管决策的90个示例,药物相关RWE文件年内发布
20家顶尖制药公司如何将AI应用于药物研发:近年来主要合作活动
浙江工业大学智能制药研究院段宏亮教授:AI制药的现状、技术与挑战
IBM的AI系统通过深度生成模型和分子动力学模拟加快抗生素发现
FDA发布人工智能/机器学习行动计划