在《机器学习驱动的药物发现:现在和明天》一文中,作者Lin Ning(一名生物科技风投家)分析了AI制药公司所拥有的三大特点:
第二个特点则点明出目前国际AI制药公司在商业模式方面呈现出的多样性,这一特点在中国公司也有所体现,虽然尚且是个雏形。第三个特点显示出AI制药公司发展之迅速,其在平台、管线、收入方面的快速扩张不可等闲视之,部分公司的成长性堪比早期的Facebook、Twitter和Snapchat,这些现象让我们不得不深入思考当下的技术浪潮对于生物科技行业的巨大变革,或许这次真的不一样。总之,Lin的分析极大地启发了笔者,借用她的框架和部分观点,辅之以笔者自身的认知,智药局形成了这篇文章。
平台第一
在平台优先或资产优先的战略之间做出选择,就像在鸡或金蛋之间做出选择。
资产就像生物技术行业的金蛋:如果药物成功上市,它们可以为公司带来巨大的价值。平台就像鸡:任何生物技术公司都可以宣称他们有一个平台,但并不是所有的平台都有生产力。然而,AI平台是不同的:它们旨在让药物开发更加工程化。AI平台的价值在于它的 "KPI",即该平台能够产生的成功药物目标或候选药物的数量。因此,AI制药公司并不陷入 "平台与资产 "的抉择争论,其基本问题是如何建立一个能提供10倍甚至100倍效率的平台。任何AI制药公司,如果想搞好药物发现这件事,都必须通过兼具质和量的数据、湿式实验室和算力资源组成的平台来实现。独特、丰富的数据集是成功的AI制药公司的法宝。简单来说,被用来训练AI模型的数据分为三大类:1)化合物库和表征数据,包括药物化合物的信息,如结构、亲和力、溶解度、稳定性等。2)分子分析数据,指的是整个生物体内生物大分子(DNA、RNA、蛋白质、甲基化等)的组学数据。3)表型数据,包括与细胞形态、细胞器动态、动物行为和患者临床数据有关的参数。公共数据库中有大量的数据。例如,PDB包含超过16万个大型生物分子的三维结构信息,而DrugBank收集了50多万种药物和药物信息。这些数据库被广泛用于建立药物发现的AI模型。然而,公共数据集在数据质量和覆盖度上有很大的差异,而且有时是非结构化的。通常情况下,数据科学家必须做大量的数据工作以确保公共数据集符合标准。因此,越来越多的公司寻求在内部生成高质量的专有数据集,这不仅赋予他们对数据质量更好的控制,而且保证他们拥有从这些数据集产生的知识产权。工程化制药药物的重点在于规模。为了产生大规模的生物数据,公司必须建立能够平行处理数百和数千个生物测定的湿实验室。而要实现这一目标,往往需要自动化实验室技术来进行辅助。算力资源包括软件、硬件和云设施。软件可用于执行和控制自动化实验室工作流程,将生物数据数字化,并开发算法。硬件可以存储PB级的数据集。云设施则使远程部署AI模型成为可能。尽管组成部件类似,但不同公司关于如何将平台整合到药物研发中的想法有很大不同。一些公司围绕一个核心功能开发技术工具,用于赋能药物研发流程中的某一步骤,而另一些公司则建立拥有多个AI模型的端到端平台。一些公司花费上亿美元来建立拥有多种细胞模型和高水平细胞分析系统的生物库,以创建不同疾病的生物图谱,而其他公司则利用现有的物理和化学知识,凭借有限的数据运作。
图:基于平台特性分类的AI制药公司
构建平台需要综合考虑各种因素,如平台与产品的匹配度、财务状况、公司的核心竞争力等等。随着自身的成长和市场的变化,许多公司也在调整他们在构建平台方面的策略。没有一个明确的 "好平台 "模板适用于每个公司。总的来说,一个好的平台是能给公司带来最大价值的平台,并能使公司为其总体目标而努力。多样化的商业模式
强大的平台推动着新商业模式的出现。对于AI制药公司来说,当他们的平台可以10倍甚至100倍的效率产生候选药物时,关于公司架构、产品组合和价值定位的策略就会发生变化。许多处于早期阶段的AI制药公司通过与生物制药公司、其他生物技术公司和政府建立伙伴关系来获得收入。1).预付款项,通常是在合作关系开始时开出的一张小支票,以支付即将进行的部分研发费用2)里程碑付款,这是在产品达到关键研发里程碑时支付的更多款项3)特许权使用费,这是产品进入市场后预先确定的收入的百分比Exscientia是一个典型的例子,它在早期发展中受益于伙伴关系。公司与杨森、礼来和DSP的合作带来了收入。正因如此,公司并不像大多数同类公司那样着急从外部融资,公司成立五年后才进行了1760万美元的A轮融资。与此同时,建立伙伴关系意味着公司必须为此投入资源,这可能与公司的重点不一致。Recursion Pharmaceuticals作为一家估值12.8亿美元的上市公司(2021年峰值价值超过60亿美元),只有两个公开的合作伙伴:拜耳和罗氏-基因泰克。Recursion将大部分资源用来扩大平台规模以及开发内部药物管线。到目前为止,他们拥有5个临床阶段的项目和20多个处于发现和临床前阶段的项目。这是以资产为中心的公司的典型商业模式。他们在内部开发候选药物,通过临床试验推动,并将产品推向市场。大多数资金充足的AI制药公司也采用这种模式,由他们的AI平台产生或重新利用候选药物。公司选择这一模式的主要原因是可观的财务利益:一个成功的药物一旦进入市场,每年可以给公司带来10亿美元的收入。而在药物正式批准上市之前,按照市场惯例,处于临床阶段的管线也会提高公司估值。尽管内部药物发现可以带来丰厚的利润,但其发展路径却非常漫长且充满风险。即使是最好的药化学家都无法做到时时正确,求AI平台也同样会犯错。为了减轻与平台相关的风险,许多公司选择从已验证的药物靶点开始,或重新利用具有已知安全性的现有药物。内部药物研发需要大量的资金支持,这些资金将被用于建设新的基础设施、进行临床试验并雇用一个专门的人才团队。为了减轻财务压力,一些公司会寻求跨国药企的合作。AI-First公司可能会分化成类似于CRO的服务提供商,将其服务作为产品出售给制药和生物技术公司。Abcellera是一家提供抗体发现服务的CRO。他们与合作伙伴合作,直到完成临床前验证,然后将其移交给合作伙伴继续进行临床开发。这种商业模式使Abcellera能够最大限度地提高其平台的效率,并通过建立一个大型的、多样化的组合来降低下游开发的风险。截至2022年底,Abcellera的客户为40家,签约的项目数量高达174个。一些AI制药公司建立了伞状的公司结构,候选药物被分散在各个子公司中。Nimbus Apollo是Nimbus Therapeutics的前子公司,成立的目的是开发由AI平台产生的几个乙酰辅酶A羧化酶(ACC)抑制剂项目。Nimbus Apollo于2016年被吉利德以4亿美元预付款和8亿美元的相关里程碑付款收购。Atomwise专注于免疫学领域3个内部管线的开发,与此同时,公司与X37和其他合作伙伴建立了几个合资企业,以孵化肿瘤学和血液学等疾病领域的候选药物。更加常见的情况是,AI制药公司将上述不同商业模式结合起来。例如,提供软件和服务的上市公司Schrodinger正在开发内部药物管线,其MALT1 抑制剂 SGR-1505 的IND申请在2022年6月获批,Schrödinger已启动了一项针对SGR-1505复发或难治性B细胞淋巴瘤患者的1期临床试验。为了应对2022年的市场低迷,一些已经在努力开发内部药物管线的公司已经重新转向服务提供者模式,以应对未来的不确定性。高速扩张
许多生物技术公司花了数年时间进行研发,才能从上市药品中产生收入。然而,以AI为动力的生物技术公司旨在创造可扩展的业务,第一代的AI生物技术公司已经上市并开始创收。以Recursion为例,近年来公司平台能力高速发展。
图:2018-2021年Recursion平台能力的增长情况
2018-2021年的三年时间里,公司现象实验的数量从8百万次增长至1.15亿次,年复合增长率达143%;数据量从1.8PB增长至12.9PB,年复合增长率达92.7%;内部化学库所含化合物数量从2.4万增长至97.8万,年复合增长率达244%;硅片库小分子数量从0增长至120亿。截至2022年第三季度,公司现象实验的总数扩大到超过1.63亿次,化合物数量超过150万种。2017年以来,AI制药公司的管线数量呈指数级增长,到2021年底,前20家AI-First的公司有158个候选药物处于发现/临床前阶段。与之对比,近年来TOP20制药公司处于发现/临床前阶段的管线呈下降趋势,2021总共披露了约330条,为十年来最少。聪明的投资者往往选择通过投资多个标的来分散风险,这也是领先的AI制药公司正在做的。在AI平台的的帮助下,这些公司可以以较低成本同时推进多条管线,通过使“投资组合”多样化来降低药物研发的总风险。Abcellera成立于2012年,从2018年开始产生稳定的收入。2018-2021年间,Abcellera的收入从1000万美元增长到3.75亿美元。
图:Abcellera的收入增速超过部分科技公司
Abcellera的收入增长与Facebook、Twitter和Snapchat早期的模式类似:收入的快速增长是由合作伙伴关系的稳步扩大支持的,就像互联网科技公司的收入与他们平台上的活跃用户数量相关一样。AI制药的新趋势
在AI驱动的药物研发领域,新的趋势开始出现,正在塑造下一代人工智能药物发现公司的前景。
新技术(iPSCs、CRISPR、单细胞技术、高通量成像、多组学等)提高了人类大规模创建、操作和测量生物系统的能力。结合先进的AI技术,我们现在可以创建一个生物图谱来明确生物系统中的各种分子、通路和相互关系。这样的生物图谱能够实现机制驱动的药物发现,并极大地提高了药物预测的准确性。包括英矽智能、Immuai、Repare therapeutics、Tango Therapeutics在内的一些公司正在利用疾病细胞模型、病人样本和CRISPR筛选来创建相关图谱,以确定新的药物靶点。Meliora Therapeutics正在建立业内首个肿瘤学作用机制图谱,公司将机器学习算法应用于药物作用机制 (MOA) 图谱开发与虚症学研究之中,并利用图谱辅助,识别能够作用于癌症靶点的化合物从而助力癌症药物的研发。据公司官网介绍,Meliora Therapeutics开发了AnchorOmics平台,在该平台中,机器学习算法能够生成每个“扰动”(perturbation)的”分子指纹”(molecular fingerprints) ,并在通过药物图谱定位该”指纹”后,映射出抗癌药物的作用机制。
图:多层次的生物机制
这些基于机制的生物图谱是精准医疗领域出现的一个强大的新型武器。通过揭示以前未知的相互作用和途径,人们对药物的认知将会更加深刻,进一步加速药物研发。在未来,数据的产生、管理和共享方式将与今天大不相同。例如,数据生成可以外包给自动化生物实验室,科学家们通过云来管理工作流程和访问数据。一些公司还为生物学家提供了一套非编码的数据分析云工具,允许未经培训的人士快速获得AI技术的赋能。此外,在数据共享方面,区块链技术让专有生物数据集可以安全地进行传输,并允许产生货币化激励,进一步打开经济上的想象空间。数据作为新型生产要素,对传统生产方式变革具有重大影响,这一点已被反复证明。在已披露的AI辅助药物研发项目中,超过六成为小分子药物,而这一比例将在未来降低。一方面,生物药品(包括抗体、疫苗、多肽、核酸等)有其自身优势:安全性更好,治疗窗口更大,而且相对于小分子药物而言,生物仿制药的进入壁垒更高,更不容易被仿制药夺去市场份额。另一方面,多组学的迅猛发展源源不断地产生海量结构化数据,使得大模型的出现成为可能(最典型的如Alphafold2),随着研究人员对生物大分子的理解更加深入和全面,生物药品的研发和产业化会迎来新的高潮。写在最后
AI技术在药物发现方面已经大放异彩,然而它仍然处于起步阶段,仍然受限于算法设计、数据质量上的不足。至少在目前,AI还不是解决所有问题的魔法,即使它能将药物研发的成功率从5%提高到10%,这仍然意味着有90%的概率失败。但可以预见的是,未来人们将对AI如何赋能药物研发有更加深入的了解,评价技术和平台的标准将会更加清晰,调整和优化算法和模型的能力也将更强。但可以确定的是,在药物研发领域,AI迄今为止取得的成就仅仅是个开始。https://ouncebiotech.substack.com/p/machine-learning-powered-drug-discovery-018?utm_source=email推荐阅读