查看原文
其他

Nat C:毕国强/周正洪合作开发冷冻电镜数据处理的新算法和软件

brainnews 2023-04-13

Science在2021年发布了新的125个科学问题,其中22个生物学问题之一:细胞内的生物分子是如何组织,从而有序、有效发挥作用的?对蛋白质等生物大分子机器的组装及工作机理的探究,俨然是当今生命科学研究的重难点问题之一。针对这一问题,该文中提到当前科学家正在发展与应用cryoET和cryoCLEM技术在纳米分辨下对生物大分子的组织分布进行探究【1】

冷冻电镜断层三维重构技术(cryo-electron tomography, cryoET),通过对快速冷冻固定的样本进行倾转成像,通过收集一系列不同角度的二维投影并进行三维重建,能够实现对保存在近生理状态下的细胞/组织样本进行纳米乃至亚纳米分辨率的三维重构成像。这一技术的快速发展与应用,使得生物学家能够在三维空间以极高的分辨率(2-3 nm)直接观察并可视化细胞内结构细节,并进行相应功能的阐释,为深入理解细胞内分子水平精细结构与功能带来新的机遇。基于cryoET的原位结构生物学,正在成为结构生物学与细胞生物学研究的主要研究手段之一。正因此,在Nature发布的2022年值得关注的七大技术中,提到cryoET技术能够在细胞环境下直视蛋白结构与功能,极具前景【2】。近期,国家自然科学基金委员会生命科学部与医学科学部发布了一系列2022年度系列专项项目指南,其中之一为 “原位冷冻电子断层成像技术与应用研究专项项目指南”【3】。这些信息,反映了cryoET技术在生命医学研究中的重要性及关键性。

然而,cryoET技术,尤其是针对细胞原位的cryoET成像技术,仍旧面临巨大的技术挑战。CryoET成像通过样品台倾转,来获得同一个样品不同角度信息,从而重构分子或细胞的三位图景。这种成像方式存在两个根本问题:1)样品倾转时,样品厚度增加,导致能够穿透样品的有效成像电子减少。实际实验中,样品倾转角度范围通常设定在+/-60°,这样导致样品三维空间信息采样不完全,这种信息缺失会导致三维重构结果产生巨大形变(即缺失锥效应,Missing wedge effects),尤其Z轴方向的拉伸使得三维结构无法正确展示和分析;2)冷冻固定的生物样品,对电子辐射损伤极其敏感,为此需要在极低电子剂量模式下进行成像,并且需要把有限的成像电子分散到多张不同角度的二维图像中,这使得最终的三维重构图像的信噪比很低。上述问题使得细胞等厚样本的冷冻电镜断层三维重构图像的分析处理,尤其是对细胞中蛋白等分子的识别以及后续三维分类与重构变得极其困难。

近日,中国科学技术大学、中国科学院深圳先进技术研究院双聘教授毕国强团队,与美国加州大学洛杉矶分校周正洪教授合作,在Nature communications上发表了文章Isotropic reconstruction for electron tomography with deep learning开发了一套基于深度学习的cryoET数据处理算法和软件IsoNet (软件下载地址:https://github.com/IsoNet-cryoET/IsoNet),有效解决了cryoET成像中的缺失锥效应和低信噪比问题。

相关阅读:

Nat Neurosci:毕国强团队利用冷冻电镜原位成像揭示抑制性突触受体组织分布规则


在生物样品中,蛋白质等生物分子的组织与分布通常是各向同性的;另一方面,cryoET成像的三维重建图像中,信息缺失主要体现在Z轴方向,XY方向具有相对完备与高分辨结构信息。基于这一假设,在没有绝对ground truth的情况下,研究人员搭建了迭代优化的自监督深度学习人工网络算法,并以旋转处理后的cryoET断层三维重构数据自身为训练集,实现了对cryoET断层三维重构数据的各向同性重构(isotropic reconstruction),即缺失锥矫正。具体而言,在每一个循环中,第一步旋转断层数据并去除其一部分信息从而和旋转数据产生数据对,第二步通过神经网络训练获得补全人为去除的信息,第三步使用网络恢复原始数据的部分信息,并把恢复的部分加到原数据中。通过不断的生成数据,训练网络,补全数据,断层成像的缺失信息会一步步的补全。同时,在IsoNet算法的流程中,可以加入降噪过程,把输入数据加上噪音项,使得一个网络可以同时进行缺失信息补全和降噪处理。因此,IsoNet算法,不仅可以很好的补齐缺失信息,而且能够达到降噪效果。

图1. 基于深度学习进行cryoET成像数据缺失锥矫正与降噪的基本原理与流程

研究人员,利用IsoNet算法对模拟缺失锥的铁蛋白 (apoferritin) 与核糖体 (ribosome) 的三维结构分别进行处理,处理后的结果能够与低分辨的原子模型相媲美。同时对真实的HIV 病毒粒子(immature HIV capsid)、副鞭毛杆(the paraflagellar rod)以及培养神经细胞中突触(neuronal synapse)的断层三维重构数据进行处理,均得到了非常好的效果。尤其值得关注的是,在利用IsoNet算法对神经突触这种典型包含大量蛋白、膜性细胞器与细胞骨架等复杂结构的细胞水平厚样品的断层三维重构图像进行处理后,突触中囊泡、线粒体、微管、微丝、细胞膜以及蛋白复合物的三维结构信息均得到了很好的恢复。

图2. 利用IsoNet算法对神经突触cryoET三维重构数据进行处理前、后的效果,以及对IsoNet算法处理后神经突触中超微结构基于真实电子密度的三维可视化渲染

IsoNet通过学习数据本身的信息来对缺失锥信息进行弥补,补全的信息全部来自于数据本身,这种设计使得IsoNet算法处理的结果足够可信。IsoNet算法在预印本bioRxiv公布后,引起了领域内的广泛关注与深入讨论,其中一个重点是IsoNet算法是如何实现缺失锥矫正的?一种主要推测是,人工神经网络在训练过程中,能够学习到蛋白质等生物结构在三维空间中不同角度的结构特征,并将这些信息补充到缺失锥方向,类似于单颗粒冷冻电镜三维平均。因此通过不断优化人工神经网络架构、扩大训练样本集等手段,IsoNet算法将能够实现对细胞中每个蛋白分子的高分辨三维结构信息进行恢复,从而为真正实现可视化细胞原位每个蛋白分子的高分辨三维结构与组织分布奠定了基础。正如领域内专家Dimitry Tegunov 等人在推特上评价认为,IsoNet算法的思路将是cryoET技术的未来发展方向。

本论文的第一作者为中国科学技术大学博士生刘云涛(现美国加州大学洛杉矶分校博士后)和2018级本科生张恒(现北京大学研究生),通讯作者为毕国强教授和周正洪教授。中科院深圳先进技术研究院副研究员陶长路博士、美国加州大学洛杉矶分校博士生王辉也参与了本文的工作。

原文链接:

https://www.nature.com/articles/s41467-022-33957-8

参考文献

[1] SCIENCE, 2021-04-11, 125 questions: Exploration and discovery, https://www.sciencemag.org/collections/125-questions-exploration-and-discovery

[2] Nature 601, 658-661 (2022) DOI: https://doi.org/10.1038/d41586-022-00163-x

[3] https://www.nsfc.gov.cn/publish/portal0/tab442/info87235.htm


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存