将量化计算和 AI 用于药物固相筛选与设计,晶泰科技拟降低不断攀升的药物研发成本
通过量化计算的方法和深度学习的技术,晶泰科技能计算出化合物所有可能的晶体结构,再通过迭代优化,最终锁定动力学中最具稳定性、最适合成药的固相、晶型。并以人工智能对药物分子物理、化学性质的预测,在后续的研发中优先选择那些药物性质最有可能成功的候选和固相,从而降低研发决策中盲目、随机的因素,以人工智能的「先见之明」解决药物研发的「后顾之忧」,让研发科学家的研发决策更加有的放矢。
撰文 | 藤子
2016 年感恩节前一天,美国一家跨国药企的总部,这家药企的负责人「惊呆了」,因为一家来自中国的成立不到两年的小公司从盲测竞争中脱颖而出,以完美的结果 PK 掉了多家欧美研究机构。
这家成立不到两年的小公司就是 XtalPi 晶泰科技,致力于将量子化学计算与人工智能相关技术应用于药物研发的关键环节。他们的切入点是化学药物的「固相」研发——包括晶型、盐、水合物的预测和筛选。
在药物的研发流程中,对药物固相的研究贯穿药物发展始终,对一款药的研发成功、顺利上市发挥着至关重要的作用。因为,药物的晶型等固相的选择不仅关系着药物的质量、决定后续的药物制剂设计,实际上,以对创新药为主的药企来说,药物的核心专利有效期通常是 20 年,然而,专利通常在药物上市之前就已生效,大多数药物在正式上架销售后被核心专利保护的时间通常只有 7—12 年。而药物固相专利可以使药物专利保护延长 2—6 年。这对于年销售额上十亿美元的重磅药物,无疑意味着巨大的价值。
晶泰科技三位联合创始人。
左起:AI 项目负责人赖力鹏、董事长温书豪、CEO 马健
晶型研究在药物研发阶段的重要性
在药物工业,尽管每年二三十种的新药上市,但这背后是超高的研发失败率,以及漫长复杂的研发过程——仅临床实验失败率就超过 90%。德勤曾经发布一份报告显示,研发一款新药的平均成本已达 15.4 亿美元,耗时 14 年。复杂和艰难的研发过程使世界上很多国家都没有生产创新药的能力,而是以仿制药为主。
研发阶段非常复杂,分为基础研发、临床试验、药物审批三个阶段。对于药企来说,降低成本、提高效率则是硬需求。由于临床试验和药物审批,既无法避免,也很难缩短时间,因此为了节约成本、提高效率,药企们在基础研发新技术的开发上一直在探索。
药物研发流程
基础研发又分为药物发现与临床前研究,一般花费 3-6 年时间。首先要进行药物靶标确认(target identification),确认引起疾病的因子或者病原体(pathogen)生存和增殖所必需的生物分子,也就是靶标。比如,人类免疫缺陷病毒(HIV)能导致艾滋病,而它增殖的必需生物分子是 HIV 蛋白酶,抑制这个蛋白酶的活性,就能破坏 HIV 病毒的增殖,进而阻止艾滋病的扩散。与其他酶类似,HIV 蛋白酶有一个活性位点,能与其他小分子相结合或作用。
确定靶标以后,药企便开始寻找与这个靶标有较强结合能力的合适的分子。合成新的化合物或对现有化合物的结构进行改造和优化,再筛选出先导化合物(lead compound),也就是有活性的化合物。对活性不够高、化学结构不稳定、毒性较大、药物动力学性质不合理的先导化合物再进行优化,一旦药物分子的化合物结构确定后,研究人员就要确定药物晶型,这往往需要不同规模、时期、详尽程度的数次实验研究。
药物固相研究
然而,在形成晶体的过程中,药物分子以及其他辅助成分(比如溶剂、盐和其他小分子等)通常具有多种空间排列方式,不同排列方式则构成不同的晶型。比如,金刚石和石墨,都是碳的同素异形体,但因为晶体结构的不同,使他们成为了不同的物质,价值也天差地别。
那么,即使是同一化学药物分子,但如果固相不同,溶解度、熔点、溶出度、生物有效性等方面就可能会有显著不同,而药物的稳定性、生物利用度及疗效都会受到影响,直接导致临床试验的成败,有的稳定性问题甚至在药物上架之后才被发现,而那时,药物就不得不下架,给药企造成不可挽回的经济损失和品牌形象的损害。
世界著名药企雅培就曾经发生过这样的事情。1998 年,其抗艾滋药物 Ritonavir(利托那韦)采用了晶型 form I,但在该药物上市两年后,发现 form I 会转变成一种新的更稳定的晶型 form II。form II 的溶解度只有 form I 的四分之一,由于溶解度更差,生物可利用度远低于预期。雅培不得不召回药物,经济损失超过 2.5 亿美元。
将量子化学计算和人工智能技术用于固相设计与筛选
在传统药物研发的流程中,采取实验试错的思路,通过 X 线衍射法、磁共振法、热分析法等方式探索晶型,不但周期长,而且成本也很高。
「传统的方式是完全通过实验的,在成本、准确性、通量上都有很大的瓶颈存在;现在我们可以用一种很巧妙的物理数学算法进行精确的预测,还可以利用发展很快的云端超级计算,极大提升整个研发过程的效率,让这种算法能够在药物工业上得到真正的实现。」晶泰科技的联合创始人兼董事长温书豪认为,通过计算,药物研究的时间可以大为缩短,成本大为减少,效率大为提高,成功率也大为提升。
具体来说,药物分子及其形成的不同晶型是一个立体的三维结构,计算分子内部以及分子-分子之间的力可以得知热力学稳定性。晶泰科技则通过量子化学计算,计算药物分子的相互作用,评估所有的三维可能,从而进行准确的晶型预测,并与人工智能的技术结合,为高性能科学计算提速,实现效率的进一步提升。
什么是量子化学计算,晶泰科技联合创始人兼 AI 研发负责人赖力鹏解释道,计算是采用传统计算机,但算法则是基于量子物理和量子化学的原理来构建。他表示,药物相关的计算,要看分子之间,分子和蛋白质之间或者蛋白质之间的相互作用。计算如果需要很高精度,就需要量子力学的知识。他用初中学物理的方式来比喻这种量化计算思维:初中物理计算中,把地球和太阳各抽象成一个点,根据两点之间的距离,计算他们之间的作用,而忽略地球上的山川河流这些微观元素。
赖力鹏介绍,在粗略的分子动力学中,计算分子之间的相互作用力,也是如此,忽略微观结构,都看成是一个点。但是这个分子间的相互作用力,是通过模拟了精确的电子和电子、电子和核等相互作用的量子化学计算得到的。按照晶体的现代点阵理论,构成晶体结构的原子、分子或离子都能抽象为几何学上的点。这些没有大小的点在空间排布形成的图形叫做点阵,以此表示晶体中结构粒子的排布规律。
实际上,随着计算机技术的发展,计算机也开始辅助药物晶型的预测,一些开源程序可以基于药物的分子结构,直接预测其可能的多晶型结构。但是该方法在药物中的成功率普遍还较低,无法达到工业应用的标准。
赖力鹏认为,根据量子力学的思路,就比「点近似」考虑得更微观,比如这个分子比那个分子多了一个原子,这个原子的微观特征与那个原子有些细微不同。如果考虑这些细小变化,计算精度则会更高。
对于人工智能技术在药物研发中的应用,赖力鹏介绍,一个基本的思路就是相似的药物分子会具有相似的性质,因此算法研发的基础是要科学、准确地量化和评价两个候选分子的相似度。好的相似性描述可以大大提高预测的准确度。在真实情景中,这种相似度的描述要起决于具体的研究问题。因此,早先基于人工特征定义(分子描述符)的 QSAR(Quantitative Structure-Activity Relationship)方法在一些特定的科研问题上就很难达到好的效果。但晶泰科技使用深度神经网络,将特征提取的工作交由机器动态执行,进而获得药物研发过程中最关心的,诸如溶解度、毒性、蛋白质作用亲和力、选择性等特征,最大限度获得高准确度的预测。
通过量子化学计算的方法和深度学习的技术,晶泰科技能计算出化合物所有可能的晶体结构,再通过迭代优化,最终锁定动力学中最具稳定性、最适合成药的固相、晶型。并以人工智能对药物分子物理、化学性质的预测,在后续的研发中优先选择那些药物性质最有可能成功的候选和固相,从而降低研发决策中盲目、随机的因素,以人工智能的「先见之明」解决药物研发的「后顾之忧」,让研发科学家的研发决策更加有的放矢。
商业之路始于盲测获胜
晶泰科技的创立之路始于波士顿的麻省理工学院,几位创始人正是在麻省理工学院完成博士后研究时的同窗。
波士顿作为制药业的「硅谷」,在剑桥地区、尤其是肯德广场(Kendall Square)周边聚集着大量来自全球的知名制药企业与生物科技领域的创新企业、生命科学研究组织、研究型医院,也有很多外国药企将美国总部设置在波士顿的剑桥市,借助与哈佛、麻省理工这些生命科学领域的老牌科研院校与相关人才的近便,掌握这一领域的前沿动态。可以说,作为「世界的药物研发实验室」的美国,其动力引擎就在波士顿/剑桥地区。
浓厚的制药氛围与完善的行业生态圈,再加上麻省理工学院的创业传统,潜移默化地影响着晶泰科技的创业团队。作为麻省理工的博士后,董事长温书豪的主要研究方向为量子经典杂化和多尺度模拟,在求学期间,他一直在进行晶型能量排位的研究。这一技术在新材料设计的诸多领域都可以应用,他们决定切入药物的研发,用这一算法提高药物工业的研发效率。
「我们当初为什么要做这个事情,就是符合这几个方向:有地理位置的天然优势原因,也看到工业界的痛点和需求,但我们的最终决定还有社会的角度——这一技术能加速仿制药与创新药的研发,使病人更快地用上价格更低的药品。」温书豪说。
在温书豪的设想中,将人工智能应用于药物研发,以智能、精确的算法超越研发人员个人经验的局限,能使成本降低、研发周期缩短,药物的价格也会更低,另一方面,能使药物研发的效率提升,药企的研发产能提高,从而能使患者更快地用上更多优质的药。
2016年,晶泰科技受到某大型跨国药企一线研发科学家的邀请,在详尽而严苛的背景调查之后,获得了药企内部一个盲测机会——使用该企业内部的分子数据,让晶泰科技用自己的算法预测药物分子的固相,再跟他们已经合成的稳定晶体、固相做对比。
几个月内,晶泰科技就完成了盲测,结果却是百分之百吻合,从一同被测试的欧洲、美国顶级研究所中脱颖而出。这个结果使药企对这支成立不久的中国团队能做出这个成绩大为震惊。
通过药企的内部测试后,该企业提供的订单数量以及与他们长期合作的热情都超乎温书豪的想象。「你要进入这个行业,就要看能为这个行业到底带来什么,做研究的要以独特的角度切入创业,早期通过技术输出的方式合作,有了技术就有更多的拓展机会。」温书豪说道。
从晶型预测平台到药物研发平台
2015 年 11 月,晶泰科技的药物固相高精度筛选与设计云平台上线,起初是基于亚马逊 AWS 云服务的云平台,如今已经扩展到腾讯云、阿里云、谷歌云,调配上百万核的计算资源。据赖力鹏介绍,依托平台的算法,晶泰科技对每个药物分子的计算中都会产生数百万到数千万的结构数据。之后,他们再通过人工智能针对这些高质量的数据进行深度学习,在进行海量计算的初期预判不同晶体结构的堆积能量,从而大大减少能量计算的资源耗费,进一步提高算法的效率。
「这对我们更加准确地预测药物分子的物理、化学性质起到重要的推进作用。」赖力鹏解释说。这个平台目前已经服务于世界级最顶尖的药企,并受到一线研发科学家们的一致推崇。
「我们把技术本身做到极致,然后把技术部署到云端或者跨云端的平台,使全世界的研发型药企都能方便地使用我们的技术,整体提升药物工业的效率。」温书豪说。
除了药物固相设计与筛选云平台之外,2017 年 7 月,晶泰科技推出了面向合作科研单位的人工智能药物研发平台 AtomPai。
之所以要推出 AtomPai,赖力鹏表示,团队的灵感来源于某次跟制药以及化工化学背景的朋友聊天时,朋友提起神经网络、自编码器等等,但不知道如何将这些方式用在化学及医药研究上。同时,在研究当中,存在大量重复代码开发,反复造轮子的资源损耗。
为了将科研人员的创造性从重复、陌生的编码工作释放出来,赖力鹏表示,晶泰科技将化学医学、制药及其它研究领域相关常用的数据分析及预测的机器学习方法部署到 AtomPai,科研工作人员就能直接在平台上调用已经实现好的,包括逻辑回归、主成分分析、支持向量机、神经网络在内的模型(已部署 30+的标准模型)进行数据分析,完成常规及复杂的数据分析任务。而如果他们有更深入的需求 50 30114 50 15290 0 0 2371 0 0:00:12 0:00:06 0:00:06 2687这些研究人员则可以与晶泰科技进行细分项目的合作,实现针对性更强的数据分析与数据挖掘任务。更重要的是,科研人员在这个平台上可以实现高质量模型的分享与数据分析方法的交流,大大提高研发的效率。
目前,AtomPai 已面向合作科研单位与数据分析者发放邀请码进行测试。据赖力鹏介绍,在未来一段时间,AtomPai 还将对更多的研发人员、科学家、学术工作者开放,在持续研发的过程中寻求广泛合作,让不会写代码的使用者也能根据自身需求建立高效的 AI 模型。
如今,晶泰科技已获得腾讯、真格、峰瑞等投资机构数千万元的 A 轮投资,并即将于近期完成来自国际知名投资机构数千万美金的 B 轮融资,成为目前人工智能结合制药领域全球范围内单笔金额最高的融资之一。
晶泰科技核心团队
温书豪,XtalPi 联合创始人,董事长。中科院博士,加州大学、麻省理工博士后。主要研究方向为量子经典杂化、多尺度模拟。
马健,XtalPi 联合创始人,CEO。浙江大学物理系本科、博士,麻省理工学院博士后。主要研究方向为量子计算和生物系统中的量子动力学。
赖力鹏,XtalPi 联合创始人,AI 项目负责人。北京大学物理学本科,芝加哥大学物理学博士及麻省理工学院博士后。主要研究方向为数学物理和计算物理,拥有丰富的程序设计经验和团队管理经验。
将人工智能用于药物研发的其他初创企业(资料源自网络)
Atomwise
通过 IBM 超级计算机分析数据库,使用深度学习神经网络分析化合物的构效关系,在药物研发早期评估新药风险,比如新药的有效性以及安全性预测。
InSilico Medicine
使用生成式对抗网络(GAN )发展、训练新的分子结构的方法,构建药物分子。不同于传统制药过程中,需要通过不断实验试错来寻找先导化合物,而是让 GAN 产生这样的化合物分子,以此减少寻找有潜在药物特性物质的时间和其他成本。
BenevolentAI
通过深度学习和自然语言处理技术理解和分析大量的生物科学资料,比如专利、基因组数据和所有生物医学期刊和数据库每天上传的出版物,找出其中的关联并提出相应的候选药物,进一步筛选具有对某些特定疾病有效的分子结构,比如可用于神经退行性疾病但没有心脏或肝脏副作用的分子。
Lantern Pharma
通过大数据与人工智能技术提高药物与癌症患者的匹配度,从而缩减新药研发在临床 2 期的周期与成本。