解决生物学50年来的重大挑战!生物界“AlphaGo”精准预测蛋白质结构
The following article is from 药明康德 Author 药明康德
点击上方蓝字“返朴”进入主页,可关注查阅往期文章
编辑 | 药明康德内容团队
提到DeepMind公司,我们首先想到的可能是几年前,它开发的人工智能AlphaGo“横扫”顶尖人类围棋职业选手,变革了围棋的思考方式。除了在棋类比赛中所向披靡以外,DeepMind也在加速科学发现上迈出了重要一步。今日,DeepMind宣布,其新一代AlphaFold人工智能系统,在国际蛋白质结构预测竞赛(CASP)上击败了其余的参会选手,能够精确地基于氨基酸序列,预测蛋白质的3D结构。其准确性可以与使用冷冻电子显微镜(CryoEM)、核磁共振或 X 射线晶体学等实验技术解析的3D结构相媲美。这一突破被多家媒体称为“变革生物科学和生物医学”的突破。前基因泰克(Genentech)首席执行官Arthur D. Levinson博士称这一成就为“划时代的进步”(once in a generation advance)。
➤生物学50年来的重大挑战
在过去的五十年中,科学家们已经能够利用冷冻电子显微镜、核磁共振或 X 射线晶体学等实验手段在实验室中确定蛋白质的形状,但每种方法都依赖于大量的试错,耗时耗力,可能需要花上好几年时间。1972年,诺贝尔化学奖得主Christian Anfinsen博士表示,理论上,蛋白质的氨基酸序列应该能够完全决定它的3D结构。这一假说激发了50年来基于氨基酸序列,通过计算方法预测蛋白质3D结构的探索。
然而,这一领域面临的重大挑战是理论上,氨基酸链可能形成的蛋白质构象的数目是个非常庞大的天文数字。有学者估计,一个典型的蛋白质理论上可以形成10的300次方(1后面加300个0)个可能构象。然而在自然界,蛋白质能够自发地在几毫秒内,迅速折叠成其中一个构象。用什么样的计算方法,才能从10的300次方的可能构象中找到那个正确的构象?
➤AlphaFold:生物界的“AlphaGo”
AlphaFold的神经网络模型构架丨图片来源:DeepMind Blog
研究人员使用蛋白质数据库中接近17万个不同的蛋白质结构,以及包含未知结构的蛋白序列数据库对AlphaFold进行训练。通过不断地迭代,AlphaFold系统学习到了基于氨基酸序列,精确预测蛋白结构的能力。
➤与实验结果相差无几的蛋白质结构预测
2018年,DeepMind开发的第一代AlphaFold首次参加CASP并且拔得头筹。而今年,新一代的AlphaFold在CASP中的表现更为惊艳。CASP使用称为GDT的评分系统来评估预测蛋白结构的精确性。这个评分从0到100,如果评分达到90分以上,可以认为预测的结构与实验手段获得的结构相当。
2006-2020年CASP比赛中最佳蛋白折叠预测系统的评分表现丨图片来源:DeepMind Blog
在今年的CASP中,AlphaFold系统对所有蛋白靶点3D结构预测的中位GDT评分为92.4分。即便是针对最难解析的蛋白靶点,AlphaFold的中位GDT评分也达到了87.0分。在接受检验的近100个蛋白靶点中,AlphaFold对三分之二的蛋白靶点给出的预测结构与实验手段获得的结构相差无几。CASP创始人Moult教授表示,在有些情况下,已经无法区分两者之间的区别是由于AlphaFold的预测出现错误,还是实验手段产生的假象。
AlphaFold根据氨基酸序列预测的蛋白结构与实验手段解析的结果几乎完全重合丨绿色,实验结果;蓝色,计算预测结果;图片来源:DeepMind Blog
➤对真实世界的影响
虽然,AlphaFold不见得会取代冷冻电子显微镜等其它实验手段,但是DeepMind的研究人员表示,这一令人兴奋的结果表明,生物学家们可以使用计算结构预测作为科学研究的核心工具之一。这一手段对于特定类型的蛋白来说可能尤为便利,例如膜蛋白一直非常难于结晶,因此很难用实验手段获得它们的结构。
而对于从事计算和机器学习研究的DeepMind团队来说,AlphaFold的表现证明了AI在辅助基础科学发现方面惊人的潜力。该团队在公司发布的博文中表示,他们相信,AI将成为人类拓展科学知识前沿最有力的工具之一!
参考资料
[1] AlphaFold: a solution to a 50-year-old grand challenge in biology. Retrieved November 30, 2020, from https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology[2] ‘It will change everything’: DeepMind’s AI makes gigantic leap in solving protein structures. Retrieved November 30, 2020, from https://www.nature.com/articles/d41586-020-03348-4[3] CRITICAL ASSESSMENT OF TECHNIQUES FOR PROTEIN STRUCTURE PREDICTION. Retrieved November 30, 2020, from https://predictioncenter.org/casp14/doc/CASP14_Abstracts.pdf本文经授权转载自微信公众号“药明康德”。
相关阅读
2 给你的生物网课加点料:世界最大冷冻电镜基地给青少年的7个科普锦囊
4 “无知的物理学家”要把冷门变成热门:缅怀结构生物学巨擘罗斯曼
近期推荐
3 文小刚:标准模型还不是一个自洽的理论+温伯格演讲丨众妙之门
特 别 提 示
1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。
2. 『返朴』提供按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。
长按下方图片关注「返朴」,查看更多历史文章