查看原文
其他

跟你聊天的 AI,也在跟研制新药的时间赛跑

这里是 WSJ中文版 2023-04-07


在寻找新型抗病药物的过程中,制药商一直以来都是通过艰难的反复试验来确定正确的化合物。


但如果人工智能可以预测新药物分子的组成——就像谷歌理解你想搜索的内容,或电子邮件程序预测你的回复(比如“知道了,谢谢”)那样,那将会如何?


当前,研究者就旨在借助一种新方法来达到这一目的;该方法使用自然语言处理的人工智能技术来分析和合成蛋白质,即生命和许多药物的基本单位。


OpenAI 的 ChatGPT 也正是依靠这种技术才产生类似人类的反应。


该方法利用了生物代码与搜索查询和电子邮件文本的共同之处:它们都由一系列字母表示。蛋白质由数十到数千个名为氨基酸的小化学亚基组成,科学家使用特殊符号来记录其序列。每个氨基酸对应字母表中的一个字母,蛋白质被表示为较长的字母组合,类似于句子。

自然语言算法可以快速分析语言并预测对话的下一步,也可用于此生物数据来创建蛋白质语言模型。这些模型对蛋白质语法进行编码以预测可能构成新药物分子的字母序列;蛋白质语法指的是表明哪些氨基酸组合产生特定治疗特性的规则。因此,药物研发早期阶段所需的时间可能会从数年缩短至数月。


ProFluent Bio 是一家总部位于加利福尼亚州伯克利的初创公司,专注于基于语言的蛋白质设计。该公司创始人 Ali Madani 说:“大自然为我们提供了大量的蛋白质示例,这些蛋白质经过精心设计,具有多种功能。” Madani 还说:“我们正在从大自然中学习这些模型。”



基于蛋白质的药物用于治疗心脏病、某些癌症和 HIV 等疾病。在过去的两年中,默克公司、罗氏旗下的基因泰克公司以及华深智药和圆壹智慧等多家初创公司都开始借助自然语言处理研发新药。


他们希望这种方法不仅能提高现有药物和候选药物的有效性,还能打开通向可治疗胰腺癌或肌萎缩侧索硬化症(ALS)等疾病的新分子的大门。针对这些疾病的更为有效的药物仍然难以找到。


位于华盛顿州温哥华的药物研发公司 Absci 的创始人兼首席执行官 Sean McClain 表示:“这类技术将开始涉及生物学中的‘无成药性’领域。”


据计算生物学家所言,用于药物研发的自然语言处理仍面临重大困难。他们认为,对现有的基于蛋白质的药物进行过多修改可能会带来意想不到的副作用,而全合成分子将需要进行严格的测试,确保它们对人体安全。


但是,如果自然语言算法的作用真的如其采用者所希望的那样,那么它们将为人工智能改变药物研发注入全新的力量。因技术限制或数据缺乏,我们从前使用人工智能可谓是举步维艰。支持者称,自然语言处理的最新进展和蛋白质测序成本的大幅下降已经在很大程度上解决了这两个问题;蛋白质测序也已产生了庞大的氨基酸序列数据库。



由于该技术仍处于早期阶段,目前各大公司专注于使用蛋白质语言模型来增强已知分子作用,如提高候选药物的功效。比如说,以一种天然存在的单克隆抗体为起点,这些模型可以对其氨基酸序列提出调整建议,从而提高其治疗效果。


在 8 月在线发表的一篇预印本论文中,Absci 的研究人员使用这种方法增强了基于抗体的抗癌药物曲妥珠单抗,使其更紧密地结合在癌细胞表面的靶标上。更紧密的结合可能意味着患者使用的剂量更少,药物治疗方案时间更短,副作用也更小。


在 3 月份发表在《美国国家科学院院刊》上的另一篇论文中,麻省理工学院、清华大学和位于北京的华深智药的研究人员使用蛋白质语言模型改造了一种仅对 alpha、beta 和 gamma 变体有效的 Covid-19 候选药物,使其也可以治疗 delta 变体。



圆壹智慧是一家业务涉及美国和中国的初创公司。该公司创始人兼首席执行官潘麓蓉表示,该公司旨在帮助客户使用此类模型将药物研发的常见起点——即动物蛋白(如来自兔子的抗体)——转化为符合人体生理学的形式。


但制药商也将其目光从已知蛋白质修改转向从头测序,即从头开始合成分子。


Genentech 表示,最近的一项实验表明,我们可以设计一种抗体,它所结合的细胞靶标与帕妥珠单抗(一种在市场上以 Perjeta 品牌销售的乳腺癌药物)一样,但具有全新的氨基酸序列。Richard Bonneau 是基因泰克公司的执行董事。去年,基因泰克收购了他所创办的 Prescient Design 后,他便加入该公司。他说:“公司科学家只为其蛋白质语言模型提供靶标和抗体所需的三维形状(这是蛋白质功能的主要决定因素)。”


Absci 和华深智药还与制药商合作,使用从头测序方法研发治疗癌症和自体免疫疾病的药物。据 McClain 称,Absci 在 1 月份宣布与默克公司建立合作伙伴关系,以研究三个药物靶标。默克公司的一位发言人表示,该公司已经进行了多项合作,探索人工智能在药物研发中的潜力。华深智药首席执行官兼创始人彭健表示,该公司上个月与两家大型制药公司签约,意在治疗此前无相关药物的疾病。



圆壹智慧的潘麓蓉说:“长期以来,药物研发中的所有难题都止步不前,一直在等待新一波技术浪潮来成功解决。这确实是一种颠覆性的方法。”


许多计算生物学家期望蛋白质语言模型除了能加快药物研发进程之外,也能产生其他好处。生物学家说,同样的技术可能用于生产更好的酶,用于降解塑料、处理废水和清理漏油等环境应用。


ProFluent Bio 的 Madani 博士说:“蛋白质是生命的基础。它使我们能够自由呼吸和看到万物;它使环境得以维持;也正因为它,人类才会生病,但也可能痊愈。如果我们可以一起设计更好的或全新的工具,那么蛋白质可能会有非常广泛的应用。”


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存