未来的药物将被发明,而不是被发现。
提出此口号的Generate Biomedicines是第一家药物生成公司,由生命科学顶级风投公司Flagship Pioneering孵化,在机器学习、生物工程和医学的交叉点上开创了“生成生物学”的先河,通过利用计算机算法人工获得自然界原本不存在的蛋白质。
Generate Biomedicines本身就是一个嵌合体:由Flagship Pioneering内部两个项目的产物在2019年融合而成。
一个最初代号为FL56的项目由Flagship Pioneering合伙人Avak Kahvejian领导,旨在将蛋白质结构的发现作为基础应用于药物发现的算法技术平台。与此同时,Flagship Pioneering的负责人Molly Gibson正在与von Maltzahn合作开展另一个代号为FL57的项目,研究机器学习在处理语言和图像等用途方面的进步是否也适用于蛋白质的氨基酸序列。要继续进行这两个方面的研究,最终都需要机器学习方面的创新,以超越对现有蛋白质的预测,转向新蛋白质的产生。那不如组建一个专业的团队,在生物学、机器学习和工程学的交叉点上工作,让来自不同领域的科学家以新的方式进行协作,共同发明和创新。这两个项目都涉及对蛋白质结构的探索,而且,还有相同的目标:建立一个创造蛋白质药物的生成平台。因此,2019年,合伙人们将FL56和FL57合并为一家公司,即Generate Biomedicines,专注于分析蛋白质结构和制造蛋白质药物。Kahvejian和von Maltzahn担任联合创始人和联合首席执行官,Gibson担任首席创新官,Grigoryan担任首席技术官。成立后的Generate将员工分为三个团队:一个专注于开发计算模型的机器学习团队,一个专注于生成更多原始蛋白质结构数据的生物工程团队,以及一个专注于临床前生物学实验的药物团队。Generate成立后仍在Flagship Pioneering的实验室部门进行了一段时间的基础研究后才于2020年被推出。直到这时,Generate才终于从三年的隐形状态中脱离,以全新的形象面向世界。 将生成生物学的愿景变为现实不仅需要将科学技术和专业知识融合,还需要大量的资金作为后盾。幸运的是,刚被推出一年的Generate就在2021年11月宣布首次外部股权融资高达3.7亿美元,这笔融资使Generate能够进一步发展其平台,并迅速扩大组织规模,储备顶级的科学和计算人才,真正开启“生成生物学”时代。一百年来,需要治疗的疾病越来越多,但是药物发现的过程却几乎没有改变。
药物发现是一个非常昂贵的试错过程,而且,随着时间的推移,只会变得越来越昂贵和低效。药物发现效率低下的指数级上升导致了药物开发成本的爆炸式增长,真正的新药商业化成本从2001年的约8亿美元增长到2020年的25亿美元以上。在机器智能的推动下,治疗开发的根本发生转变,产生不同于今天存在的蛋白质。Generate提出了一个问题:如果我们不必通过反复试验来发现蛋白质药物,而是使用新的计算工具产生新的蛋白质疗法,这有可能吗?常规的蛋白质药物只是以“试错”的方式,对现有的分子做出微小改变。为了打破此僵局,Generate开启全新的领域,不再局限于生产自然界中已经存在的东西,而是从头开始生成具有特定功能的全新蛋白质。在过去十几年中,机器学习已经彻底改变了计算机视觉、自然语言处理、语音识别、医学成像和计算生物学等领域。大型数据集的出现加上处理技术的进步使得训练庞大的神经网络变得切实可行。计算能力的持续提高,加上高通量生物数据生产的指数级增长,为科学家带来了药物发现和开发的新时代。
从观察到分析,再到新蛋白质的产生:Generate已经在功能强大的处理器上运行机器学习算法分析了数以百万计的已知蛋白质,寻找连接序列、结构和功能的统计模式,以便学习自然编码蛋白质功能的可推广规则,利用这些学到的规则,并辅以专有的实验数据,根据需求生成自然界中本不存在的蛋白质专有序列,生成定制的蛋白质疗法(短肽、抗体、酶、基因疗法、蛋白质组合物等),最终形成具有特定治疗功能的新药。这个过程大大提高了药物发现的成功率,并减少了药物发现所需的时间,Generate称之为“生成生物学”,扩大了Generate治疗疾病和解决复杂生物学挑战的能力,代表了治疗开发领域可能性的根本转变,拥有广阔的潜力。03
构建专有的Generative Biology平台
从传统的药物发现到“生成生物学”的转变引起了生命科学领域的巨变。Generate不再以发现自然界原本存在的可用于治疗的药物为目的,而是以生产自然界没有的药物为核心;也不仅仅是从实验室观察到的东西中寻找机会,还通过识别疾病中涉及的特定生物过程来创造治疗机会。
Generate已经证明生成生物学可以应用于所有蛋白质模式,并产生具有所需功能的新型蛋白质。为更好更快实现按需生产蛋白质的目的,Generate从所有已知的蛋白质中学习,应用基因序列编码蛋白质结构和功能的基本原理,构建了专业的Generative Biology平台。该平台主要创建具有治疗潜力的新型蛋白质序列,值得一提的是,该平台的通用性使酶、肽和抗体的创建具有广泛的应用,并且使开辟全新类别的蛋白质药物成为可能。Generate专有的Generative Biology平台可以以前所未有的速度和成功率按需生产与当今任何药物都不同的定制蛋白质药物。通过机器算法生成各种类型的蛋白质复合物,包括抗体和肽、酶、隐形蛋白质(在计算机鉴定中鉴定一种新型蛋白家族,使细菌病原体对宿主免疫防御不可见),甚至在不到3周的时间内产生了针对SARS-CoV-2的新型治疗蛋白。Generative Biology平台克服了多种限制蛋白质药物发现的壁障,使以下愿景成为现实: 2.产生针对膜靶标或多蛋白复合物的抗体这些抗体传统上难以在体外表达4.生成高选择性分子,能够区分所需目标和不需要的目标Generative Biology平台的一大特色是可以预测所需靶标的新型结合剂,即能够生成将特定表位结合在所需靶标上的抗体,实现按需利用计算机算法生成有效抗体。
人类免疫系统识别和消除非人类蛋白质的特性,限制了许多生物药物发挥其疗效。所以生产有效的生物药物需要控制蛋白质序列、结构、功能和免疫激活之间的关系。利用Generate的Generative Biology平台生成抗体,在完全重新编码治疗性蛋白质以保持其结构功能的同时还能减少或消除免疫系统的识别。Generate目前有六种候选药物处在研发阶段,虽然并未向外界披露更对细节,但其用于射血分数降低的心力衰竭(HFrEF)的主要候选药物GEN-387有望在2022年进入临床试验。虽然目前Generate的重心仍放在内部研发自己的产品,但是Generate也并不是闭门造车,在积极研发产品的同时也不忘与外界制药公司建立合作伙伴关系,以谋共赢。2022年1月6日,安进(纳斯达克股票代码:AMGN)和Generate宣布了一项合作研究协议,旨在为多个治疗领域的五个临床靶点发现和创造蛋白质疗法。根据协议,安进将为最初的五个项目支付5000万美元的前期资金,对于每个计划,安进将在未来的里程碑和版税中支付高达3.7亿美元的费用,安进还将参与Generate未来一轮融资。将安进的生物制剂药物发现专业知识与 Generate Biomedicines 人工智能 (AI) 平台的强大功能相结合,通过缩短发现时间并生成具有可预测可制造性和临床行为的潜在先导分子,为进一步促进多特异性药物设计提供了更多机会。