Nature | 刘海燕/陈泉团队报道蛋白质从头设计的神经网络能量函数
蛋白质是生命的基础,是生命功能的主要执行者,其结构与功能由氨基酸序列所决定。目前,能够形成稳定三维结构的蛋白质,几乎全部是天然蛋白质,其氨基酸序列是长期自然进化形成。在天然蛋白结构功能不能满足工业或医疗应用需求时,想要得到特定的功能蛋白,就需要对其结构和序列进行设计。目前,国际上已报道的蛋白质结构从头设计工作使用天然结构片段作为构建模块来拼接产生新结构【1】。这种方法显著限制了人工设计蛋白的结构多样性和可变性。对蛋白质从头设计中最困难的问题 ——如何充分地探索蛋白质主链结构空间,从头发现新颖的、“高可设计性”主链结构 —— 还缺乏系统性的方法。
2022年2月9日,中国科学技术大学刘海燕教授、陈泉副教授团队在Nature发表题为A backbone-centred energy function of neural networks for protein design的研究论文,采用数据驱动的策略,开辟出一条全新的蛋白质从头设计路线,在蛋白质设计这一前沿科技领域实现了关键核心技术的原始创新,为工业酶、生物材料、生物医药蛋白等功能蛋白的设计奠定了坚实的基础。
所谓“高可设计性”主链空间结构(Designable Backbone),是指能够自发稳定折叠成该结构的氨基酸序列真实存在。理论和实验研究表明,在所有化学上合理(键长、键角和二面角等内坐标合理、原子间无空间位阻冲突等)的海量可能主链空间结构中,只有极少比例的结构具有高可设计性。毫无疑问,天然蛋白的结构具有“高可设计性”。蛋白质设计要解决的最关键问题,是如何自动、高效地的产生“高可设计性”的人工主链结构。
中国科学技术大学相关团队长期深耕计算结构生物学方向的基础研究和应用基础研究;施蕴渝院士是国内这一领域的开拓者;刘海燕教授、陈泉副教授团队十余年来致力于发展数据驱动的蛋白质设计方法。该团队首先建立了给定主链结构设计氨基酸序列的ABACUS (A Backbone-based Amino aCid-Usage-Survey) 模型【2】,进而在本文中发展了能在氨基酸序列待定时从头设计全新主链结构的SCUBA(SideChain-Unknown Backbone Arrangement)模型(图1),该模型采用了一种新的统计学习策略,用从蛋白质结构原始数据中学到的计算神经网络来指导主链结构优化,从而可以高保真地刻画可设计性主链结构中的高维关联。用SCUBA能量模型驱动随机动力模拟,可以在序列待定的前提下连续、广泛地搜索主链结构空间,自动产生“高可设计性”主链。
“SCUBA+ABACUS”构成了能够从头设计具有全新结构和序列的人工蛋白完整工具链,用其进行蛋白质从头设计的基本流程包括:首先根据需求提出设计目标(例如要求蛋白质结构的整体或局部满足特定条件),根据设计目标搭建近似的初始主链结构(可基于简单的几何规则计算搭建或在计算机图像系统帮助下人工搭建,也可以随机产生);从初始结构出发,用SCUBA方法对主链结构进行连续自动优化,获得真正能通过选择氨基酸序列来实现的主链结构(即“可设计性”高的主链结构)进行自动优化;基于优化后的主链用ABACUS选择合适的氨基酸序列,并根据该序列对主链结构进行进一步修正;对经过多轮结构优化-序列选择迭代后的最终序列进行评估筛选后,用实验方法获得并表征人工蛋白。
理论计算和实验证明,用SCUBA设计主链结构,能够突破只能用天然片段来拼接产生新主链结构的限制,显著扩展从头设计蛋白的结构多样性,设计出不同于已知天然蛋白的新颖结构,是RosettaDesign之外目前唯一经充分实验验证的蛋白质从头设计方法,并与之互为补充。在论文中,团队报道了9种从头设计的蛋白质分子的高分辨晶体结构 (图2) ,它们的实际结构与设计模型一致,其中5种蛋白质具有不同于已知天然蛋白的新颖结构。
图2. 从头设计蛋白的高分辨晶体结构(天蓝色)与设计模型(绿色)比较。
综上,该研究原创性地建立了基于数据驱动的蛋白质主链设计方法,可以探索更广阔的蛋白质主链构象空间,为后续按需设计具有特定空间结构和预期功能的全新蛋白质奠定了基础,相关研究工作正在进行中。
参考文献
1. Kuhlman, B. et al. Design of a novel globular protein fold with atomic-level accuracy. Science 302, 1364-1368, doi:10.1126/science.1089427 (2003).
2. Xiong, P. et al. Protein design with a comprehensive statistical energy function and boosted by experimental selection for foldability. Nature Communications 5, 5330, doi:10.1038/ncomms6330 (2014).
转载须知
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经允许禁止转载,作者拥有所有法定权利,违者必究。