晶泰科技温书豪:谷歌看中的是我们物理底层的核心|专访
编者按:生辉在调研“AI+制药”的业内头部公司和多家本土 VC 之后,发现真正具有核心技术,能建立强固商业壁垒的本土 AI 制药公司屈指可数。为探究其中原因,生辉找到了目前全球人工智能药物研发领域融资额最高的企业之一——晶泰科技。该公司成立于 2015 年,先后拿到了腾讯控股、谷歌母公司 Alphabet、红杉资本、中国人寿、SIG、晨兴资本等共七千多万美元的投资。
晶泰科技联合创始人兼董事长温书豪对生辉阐明了为何晶泰会受到资本市场青睐的秘密。
图 | 晶泰科技联合创始人兼董事长温书豪(来源:晶泰科技)
谷歌看中的是我们物理底层的核心
生辉:晶泰的英文名 XtalPi 是什么寓意?
温书豪:我们刚开始成立公司的时候是从药物晶体切入的,“Xtal”也就是 crystal(晶体),Pi 是圆周率,代表我们是一家算法驱动的公司,也是我们对精度的追求。另外,爱因斯坦的生日也是 Pi Day,对于我们学物理的人来说也是对他的纪念。
生辉:当时为什么想到去做药物相关的研究?
温书豪:我们当时在波士顿的 MIT,MIT 鼓励不管是教授还是博士、博士后去把科研成果转化成公众利益,创业氛围很浓。另外,波士顿是所谓“药的硅谷”,我们做物理的人也会受到药物工业大环境的影响。
至于我们为什么选择从晶型预测切入,那是因为在 2015 年的时候一款治疗多发性骨髓瘤(multiple myeloma)最好的药的晶型专利被别人挑战,当时我们就认为,一款药物先不说它的机理,它要变成产品去生产的话,一定要有一个稳定的承载形式,也就是晶型,同时还涉及到专利问题,刚才提到的这款药一年能卖一百亿美金,你要是能越过它的专利就能获得巨大的商业回报。晶型就是一个物质结构的问题,我们搞物理的可以从基础理论底层搞得很清楚。
我们和辉瑞的合作从 2017 年开始,他们在官网上有一篇文章专门报道了和我们的合作,(原文链接:https://www.breakthroughs.com/health-tomorrow/how-quantum-physics-and-ai-disrupting-drug-discovery-development)里面有一句话我觉得很有道理,现在一款药物一年销售额十亿、百亿美金,难道我们不应该从原子、电子的层面去理解药物吗,从更底层更微观的层次去理解,做药就会比过去更准、成功率更高。
图 | 晶泰帮助科学家预测和优化潜在药物分子的晶型(来源:Pfizer)
宇宙都是由原子电子组成的,包括药物包括人体的蛋白都是原子电子组成的,我们设计药物要知道药物分子是怎么和靶点结合起来的,这还是一个物理问题,以前是在宏观的层面去理解,现在要理解清楚的话必须要越来越微观。为什么我们的物理背景让药物工业的客户喜欢,这是因为从我们这个角度去做算法,准确度很高,这是我们作为一家华人公司要去和美国同行竞争的根本。
生辉:您提到的算法的准确度高低是如何衡量的?晶泰的准确度指标如何?
温书豪:很多公司一直把晶型预测当做晶泰的标签,但是我们2018年上一轮募资之后主要的 milestone 是 AI 新药研发了。算法准确度的衡量,对于晶型预测算法是可以直接拿算法预测出的晶体结构和现实实验中的单晶结构做对比,看是否重合,看我们是否能预测出所有实验找到的晶体;新药研发就是一个多目标函数优化,药厂会给我们靶点,让我们去做分子预测,它的活性、成药性、毒性等等指标都是有数值的,实验测出的数值和我们算法算出来的物理量是可以去做对比的。符合就是准确。
生辉:那么晶泰的准确度表现如何?
温书豪:因为算法有很多,这里可以分几种。晶型的话,2019 年我们对所有服务客户的稳定晶体预测的成功率是 100%,这是 2017 年或者 2018 年看不到的数据,因为算法公司有个特点就是会越来越准、越来越快速。另一个是关于力场和 free energy perturbation 模型(自由能微扰模型,用来算药物分子和靶点结合)这算法的结果与实验结果的线性相关度很高,预测药物分子和靶点的结合情况,结合使用策略可使得计算与实验的线性相关度超过 90%。这两个都是根据物理模型构建的算法,它的准确度极高。人工智能是数据驱动,不能单一通过物理学第一性原理构建,比如说在逆合成方面,就是判断设计的药物分子如何合成出来,这方面算法我们也有 85% 甚至 90%的准确度。业界有一些公开的竞赛可能在 80% 左右。在这些具体的药物发现关键环节不同类型算法工具的准确度,我们一直在追求业界的最高标准,这是我们作为一家中国公司在美国市场生存的根本。
生辉:你们的什么优势促使你们达到了这样的准确度?
温书豪:物理底层是我们最大的差异化。我们是腾讯和谷歌在全球范围内的唯一一家联合投资的 AI 药物研发公司,谷歌可能是全球 AI 最好的公司,他们就是看中了我们物理底层的核心。我刚才提到的晶型预测算法,这是一个极度有挑战的问题,全世界做到工业级别的、准确度如此之高的只有我们一家。自由能微扰算法方面,我们是在市场上最好的竞争对手的基础上,我们做到准确度更高、迁移性更好,可以覆盖更大的化学空间。为什么能做到这样?我们团队的人都在相关领域有十几年的积累,具备最底层物理理论开发的能力,物理模型是比 AI 模型更准的。另外一方面,也必须要有算力的支撑,AWS(亚马逊云端计算服务)曾把晶泰放在官网上做案例研究(https://aws.amazon.com/cn/solutions/case-studies/xtalpi/),我们在算力上的消耗巨大,去年我们在 AWS 上总的算力消耗是 3 亿个核时,主要是以欧美的一些大药企为主,不是特别多家,我们早期比较专注,希望把大客户做好、做透。
解决 AI 当下面临的问题,需要更多投资人和工业界的耐心
生辉:AI 在辅助化合物筛选中需要大量数据来训练模型,晶泰的物理模型也需要大量数据吗?
晶泰:晶型预测方面我们完全具备自建数据的能力,我们通过晶体学规则能构建起很多晶体的堆积方式,然后通过数万次的量子力学计算来捕捉电子效应,训练出更准的经典力学力场,然后再去处理。所以说我们并不需要外部的数据。
生辉:晶泰的物理模型和 AI 算法之间的关系是什么?
晶泰:像 GANs、DL 这只是我们用到的一部分,我们还用到了 Alpha GO 的全局搜索。第一个模块就是 GAN model,AI 会根据给靶点去学习很多过去的化学结构,然后根据目标再去产生和生成更多新的药物分子结构,这一块是比较 AI 的部分;第二个是可以去学习一些分子和靶点相互作用的数据,可以来预测分子和靶点的 binding affinity;再往下一层就是刚才提到的基于专属化力场和自由能微扰建的一套基于物理的模型来预测分子和靶点能否结合;再往下就是几十种成药性性质的预测;之后是逆合成分析预测,这个也是靠 AI;最后一个是溶解性预测。这六个模块会不断根据反馈结果进行优化迭代和强化学习,其中有四个模块是与 AI 相关的。
生辉:外界给晶泰的标签更多是晶型预测,我看到你们的官网还有小分子药物设计和一些人工智能服务,这两项业务进展如何?
温书豪:AI新药发现方面我们在这两年有很多突破,第一个就是我们帮一个大药企花两年时间做了一个云端巨大算力直接开放式的专属化力场 +XFEP 的新平台,反馈很好,围绕着这个核心模块,我们开发出上面介绍的 6 个维度的 AI 新药研发引擎。从技术层面,刚才提到的六个模块在中美会有超过 15 个创新药在推进,我们会帮他们用更短的时间、更低的成本、更多的专利覆盖,去发现具有生物活性和具有临床价值的新分子结构,其中多个新药的进展非常不错,在未来一年时间内会有数个进入到临床阶段。
在全球范围里,晶泰应该是所有的 AI 医药研发公司里最大的一家,大概有将近 200 人,北京团队有 50 多人,主要做 AI 算法,AI 服务这一块主要是与各个国家最一线的企业合作。晶泰的股东背景也是全球范围内最有特色的一家,包括技术巨头 Google 和腾讯。
生辉:200 人的团队中,各专业背景的人占比是多少?
温书豪:最多的还是物理背景,大概有三四十个。我们在深圳有 130 人左右,其中有二十多个“孔雀人才”(归属于孔雀项目,是深圳经济特区于 2010 年推出的引进高技术人才的项目),这是很少见的。
(来源:晶泰科技)
生辉:目前存在一种情况是,很多传统的药厂不太相信 AI 技术,不愿意和相关的 AI 公司合作,这个问题能否解决?
温书豪:任何新东西从出现到被接受都有个过程,就像互联网经历过几轮泡沫一样,找对应用场景后,最终在搜索、社交、电商几个方向出来万亿级别的巨头公司。药物工业的数字化和人工智能升级是一个必然的趋势。
目前很多数据都掌握在药厂手里,比较中心化,很多AI 公司没有数据就不能去构建AI模型,这是很大的挑战,但我的观点是,经过时间的积累,一定会看到 AI 在药物工业中起到重要甚至是变革性的作用。但是这需要投资人和工业界的耐心,需要工业界更 open 的态度。
生辉:我们在此前专访过 Insilico Medicine,他们想要去解决可解释性的问题,所以打算将链条延伸到临床,你怎么看这种思路?
温书豪:我很赞同这种想法,但是我觉得实现也有难度。因为一旦进临床那么会有很大的耗费。我们更愿意与合作方共同来推动。
生辉:现在公司的营收情况如何?
温书豪:我们在全球范围内和多家大药企有合作多个业务,而且都是欧美、日本和中国一些一线的大药企,还有一些中小型的具有创新力的生物技术公司。从金额来看,我们应该是最高的几家之一,而且有比较稳定的现金流。像晶型预测这种服务,费用是稳定的,不存在什么风险。因为药企都会有这一块的需求,他们还是会做传统实验,我们的预测就像是一个作战地图一样,一些转动自由度特别高的分子,和复杂的体系,全世界只有我们能做。
生辉:近期有和国内一些大药厂谈合作吗?方便透露吗?
温书豪:今年我们和博腾(博腾股份)签了战略合作协议,新药研发和国内几家大的企业在谈合作,近期会有消息的发布。
生辉:如何去评价一家 AI 制药公司在行业内的地位?
温书豪:一是看你的 AI 算法或者 AI 技术是否真正能落地,其中一个判断的维度就是有很多大企业愿意给你付费,甚至是反复付费。因为这些大企业本身有很高的技术标准,他有非常严格的评估体系来找到最好的技术,也只会用最好的技术。他们不会在没有意义的技术上浪费时间和金钱的。但另外比如投资人的背景、融资方面也是一个判断维度。总之股东背景和客户背景是行业地位很重要的参考标准。
生辉:此次新冠对晶泰的影响大吗?
温书豪:我们觉得广谱抗病毒药会是一个机会,AI 能在其中起到特殊的作用。另外我们是算法模式的类似线上业务的模式,尽管因为疫情,很多包括欧美的药企很多都没法线下做实验,甚至 work from home, 但是我们这种线上的研发业务不受影响,我们甚至在疫情期间也新签了一些的订单,因为都是在线上营业,所以业务没有受到影响,可能还有一些增加。
生辉:晶泰的愿景是什么?
温书豪:通过人工智能和巨大算力,催生更多的药物资产,让整个行业受益,最终也惠及患者,给他们带来更多、更便宜的药物。
上一次药物工业的效率升级可能是因为出现了很多 CRO,我们希望在这一次药物工业数字化人工智能升级的效率升级中,利用好我们的物理底层能力,利用好人工智能,利用好云端算力,能在全球范围内这个领域里深度探索产业革新的机会,最终。我们也希望在这个过程中大家能有足够的耐心,支持这些 AI 药物研发企业做正确而不容易的事情。
-End-