Science|AI揭示了蛋白质复合物的结构
以下是全文内容。
蛋白质结构预测方面的人工智能(AI)革命仍在继续。仅在一年前,软件程序首次成功地对单个蛋白质的三维形状进行建模,其准确度与几十年前的实验技术所能确定的一样。今年夏天,研究人员使用这些人工智能程序组建了一个接近完整的人类蛋白质结构目录。现在,研究人员再次提高了难度,公布了一套程序组合,可以确定哪些蛋白质有可能相互作用,以及由此产生的复合物(细胞的重要引擎)是什么样子。
斯坦福大学的系统生物学家Michael Snyder说:"这是一个非常酷的结果。生物学中的一切都在复合物中工作。因此,知道谁和谁一起工作是至关重要的。这些关系在以前的技术中很难达到。预测这些关系的新能力有助于产生对细胞生物学的一系列见解,并可能揭示下一代治疗药物的新靶点。"
这两种蛋白质形成了一种蛋白质复合物(参与酵母中DNA修复);人工智能软件预测了这两种蛋白质的结构。
直到最近,绘制蛋白质形状的原子尺度图还需要昂贵而缓慢的实验技术,如X射线晶体学和核磁共振光谱。这些实验技术,如果它们能起作用的话,通常只能产生单个蛋白质结构。
几十年来,计算机建模专家一直在努力加快事情的进展。他们最近的成功取决于深度学习算法,该算法使用实验提供的蛋白质结构数据库,来训练软件程序如何根据其氨基酸序列来预测蛋白质的结构。
去年,两个小组(一个来自英国一家名为DeepMind的公司,另一个由西雅图华盛顿大学的David Baker领导)创建了相互竞争的人工智能程序,现在这两个程序都能预测出数以千计的蛋白质结构(Science, 30 July, p. 478)。该软件还产生了少数已知蛋白质复合物的结构,主要是在细菌中(Science, 16 July, p.262)。但是真核生物中(从酵母到人的有机体)相互作用的蛋白质伙伴往往是未知的。识别它们并预测它们如何在一个复合物中结合在一起,对最初的程序来说是一个太高的标准。
现在,这两个研究小组已经调整了他们的程序,以便他们能够解决数以百计的蛋白质复合体的结构。本周在《Science》杂志上,Baker和他的同事们使用人工智能技术的组合,来解决真核生物中712个复合物的结构。
为了找到可能一起形成复合物的蛋白质,该团队首先将所有6000个酵母蛋白质的氨基酸序列与来自2026个其他真菌和4325个其他真核生物的蛋白质进行比较。这些比较使研究人员能够追踪这些蛋白质在进化过程中是如何变化的,并确定在不同蛋白质中出现串联变化的序列。研究人员推断,这些蛋白质可能形成了复合物,它们按部就班地变化以维持其相互作用。然后,研究小组使用其名为RoseTTAFold的人工智能程序,以及DeepMind的AlphaFold(公开可用),试图解决每组候选者的三维结构。在830万个确定的共同进化的酵母蛋白对中,人工智能程序确定了1506个可能相互作用的蛋白质,并成功绘制了712个(即大约一半)的三维结构。
团队成员、德克萨斯大学西南医学中心的生物医学信息学专家Cian Cong说:"这些相互作用跨越了真核细胞的所有过程"。Cong和Baker说:"其中的亮点是蛋白质复合物的结构,这些复合物允许细胞修复其DNA的损伤,将RNA翻译成核糖体中的蛋白质,在细胞繁殖期间将染色体拉开,并通过细胞膜运送分子。"
DeepMind的John Jumper(AlphaFold的主要开发者之一)说:"这是一个很好的例子,说明了三维结构的前景。通过精确揭示蛋白质之间的相互作用,这些模型应该帮助生物学家直观地了解以前未知的复合物是如何在细胞内执行多种工作的。"
Cong说:"这些模型为实验者提供了可供测试的假说。由于破坏这些相互作用可以提供干预各种疾病的新方法,它也提供了很多潜在的药物新靶点。"
更多的可能在路上。上个月,Jumper和他的同事在bioRxiv上发布了一份预印本,描述了他们的人工智能的一个新版本,被称为AlphaFold-Multimer,它绘制了4433个蛋白质复合物的结构(文章见BioRxiv|利用AlphaFold-Multitimer进行蛋白质复合物预测)。人工智能程序中衡量每个折叠的置信度的分析表明,这些结构有69%的机会是准确的。最重要的是,Baker说:"这确实是结构生物学的一个令人兴奋的时刻。"
----------- End -----------
感兴趣的读者,可以添加小邦微信(zhiyaobang2020)加入读者实名讨论微信群。添加时请主动注明姓名-企业-职位/岗位 或
姓名-学校-职务/研究方向。
- 历史文章推荐 -
【AlphaFold】
●BioRxiv|利用AlphaFold-Multitimer进行蛋白质复合物预测
●谷歌母公司推出AI驱动的药物发现初创公司Isomorphic Labs
●Nat Rev Drug Discov|AlphaFold对药物发现意味着什么?
【药物设计】
●Drug Discov Today|人工智能增强的药物设计和开发:迈向计算型精准医学
●Drug Discov Today|用于从头药物设计的图神经网络GNN
●Nat Commun|AI结合基因表达特征,从头生成类苗头化合物
●Drug Discov Today综述|分子从头设计和生成模型
●Nat Comput Sci综述|生物分子建模在技术时代蓬勃发展
【靶点发现】
●Nature Outlook|借助算法和模拟将蛋白质折叠的瞬时结构转变为药物靶点
●AI+临床数据助力新药靶点发现,天坛医院院长王拥军谈【神农计划】
【临床试验】
●NPJ Digit Med|多种数字健康技术在去中心化的世界中赋能临床研究
●Nature:如何使用AI分析真实世界数据,简化肿瘤临床试验入组标准
【产业进展】