胡名旭/包承龙发文详解创新算法CryoSieve使用流程:可逼近冷冻电镜重构结构所需最少颗粒数量极限
冷冻电子显微镜(cryogenic electron microscopy, cryo-EM)是一种广泛用于确定生物大分子近原子分辨率结构的技术。由于生物大分子样本对电子辐射高度敏感,研究人员需在提高信噪比与减少辐射损伤之间进行权衡。这一物理限制导致研究人员无法从单个生物大分子图像获取原子级分辨率的三维结构。因此,通过平均多个相同生物大分子的图像数据来增加信噪比,成为了唯一的可行方法。
为确定样本结构,从原始数据中提取的单颗粒图像需要经过多轮二维和三维分类,形成最终颗粒集(final stack),这通常只包含原始数据集的一小部分颗粒,但能产生原子或近原子分辨率的密度图。二十多年前,2017年诺贝尔化学奖得主Richard Henderson就已经提出估计:即使对于分子量只有40kDa的生物大分子,也可以通过平均大约12,000个单颗粒图像,来确定接近3Å分辨率的结构。当前实践中,用于冷冻电镜结构重构的颗粒数量仍远超理论极限,暴露出颗粒筛选技术与冷冻电镜物理极限之间的显著差距。这一问题长期困扰冷冻电镜领域,阻碍了对样品制备方法性能的量化评估,也妨碍了对样品行为趋势及其背后潜在机制的深入研究。
为解决这一问题,胡名旭及其合作者开发了CryoSieve软件。该软件采用新算法,通过从冷冻电镜最终颗粒集中去除大部分颗粒,显著提高了重构密度图的质量。在研究团队测试的八个数据集中,有三个 (pfCRT、TSHR-Gs和apoferritin)在经过CryoSieve筛选后,所需颗粒数接近于Henderson和Rosenthal提出的理论极限[1]。
该研究成果已发表于Nature Communications,并入选该杂志2023年度最受欢迎物理学论文Top25榜单,受到国际冷冻电镜研究领域的高度关注。今年四月,CryoSieve获SBGrid联盟收入结构生物学常用算法库[2],并获《中国科学报》头版报道。
[2] https://sbgrid.org/software/titles/cryosieve
2024年5月10日,胡名旭特聘研究员、包承龙助理教授在Journal of Visualized Experiments杂志上发表了题为“Enhancing Density Maps by Removing the Majority of Particles in Single Particle Cryogenic Electron Microscopy Final Stacks”的研究论文。文章采用案例研究形式,逐步介绍了CryoSieve软件的使用流程,并配有实验视频详细解析各个步骤。
CryoSieve作为一款开源软件,现已提供在GitHub平台下载(https://github.com/mxhulab/cryosieve,或点击文末“阅读原文”进入下载页面)。为方便用户,其GitHub主页提供了详细的使用说明和视频教程。此外,为支持科学研究,更多的数据集及CryoSieve运行后的预期输出结果也已上传至该平台。用户可通过CryoSieve的主页访问和下载这些资源,以便在自己的研究中应用和参考。
深圳医学科学院特聘研究员、北京市生物结构前沿中心(清华大学)青年科学家胡名旭,清华大学丘成桐数学中心助理教授、北京雁栖湖应用数学研究院助理研究员、清华大学膜生物学重点实验室研究员包承龙为本文的共同通讯作者。深圳医学科学院研究助理蔡梦佳、清华大学丘成桐数学中心博士研究生祝健颖,清华大学生命科学院博士研究生张起为本文的共同第一作者。清华大学数学科学系硕士研究生徐煜、清华大学丘成桐数学中心教授、北京雁栖湖应用数学研究院研究员史作强作为共同作者。
本研究受到深圳医学科学院特聘研究员启动经费、北京市生物结构前沿研究中心(清华大学)、北京市结构生物学高精尖创新中心(清华大学)、国家重点研发计划和国家自然科学基金的资助。
招聘副研究员
胡名旭博士,博士生导师、研究组负责人(PI),2013年本科毕业于清华大学数学物理基科班,2018年博士毕业于清华大学生命科学院。后在北京结构生物学高精尖中心(清华大学)和北京生物结构前沿中心(清华大学)任青年科学家。2023年8月入职深圳医学科学院,任特聘研究员。
胡名旭课题组长期专注于开发冷冻电镜图像的处理算法,已先后开发出多套先进软件;专注于解决冷冻电镜图像处理领域的难题,在该领域居于国际前沿水平。当前,课题组的研究兴趣是发展冷冻电镜的高通量结构解析技术,开发基于定向进化的蛋白设计方法,探索生物大分子的工业化应用场景。
目前,胡名旭课题组正积极招聘两名副研究员(Co-PI)。第一位候选人需精通冷冻电镜结构解析全流程,包括蛋白提纯、冷冻样品制备及电镜操作,并对冷冻电镜图像处理有所了解。如具备构建重组蛋白(尤其是支架蛋白)或表达及提纯纳米抗体的经验,将优先考虑。第二位Co-PI则需掌握蛋白质结构预测及设计流程,拥有深度学习和大模型操作经验的候选人优先。
相关阅读
1. 深圳医学科学院胡名旭课题组招聘2. 包承龙/胡名旭/史作强发文阐明冷冻电镜最终颗粒集中少数颗粒可以产生更优的振幅3. 祝贺包承龙/胡名旭/史作强论文入选『自然-通讯』2023年最受欢迎物理学论文Top25榜单