近日,上海人工智能实验室(上海AI实验室)与复旦大学联合团队提出了智能算法OPUS-DSD,推动高精度生物大分子结构模型建立,高效助力新药研发。
目前,该成果相关论文“OPUS-DSD: deep structural disentanglement for cryoEM single-particle analysis”已刊发于Nature旗下刊物Nature Methods(影响因子:47.99)。该算法代码同时开源。
|论文标题:OPUS-DSD: deep structural disentanglement for cryoEM single-particle analysis
|论文链接:https://www.nature.com/articles/s41592-023-02031-6(点击阅读原文直达链接)
|开源链接:https://github.com/alncat/opusDSD
智能算法OPUS-DSD能够成功地解析冷冻电子显微镜(Cryo-EM,以下简称“冷冻电镜”)下因传统研究方法无法分辨而缺损的生物大分子(如蛋白质、核酸或蛋白质/核酸复合物等)结构,高效精准地分辨出柔性结构域在受测样品中的构象分布。这一算法具备有效建立高精度的生物大分子结构模型的能力,解决新药研发过程中因目标蛋白结构不准而导致失败的问题。当前,生物大分子结构解析是基础生物科学的关键技术之一,对揭示分子生物学底层机理、重大疾病原理及创新药物研发具有重大意义。生物大分子的许多重要功能通过其高度的柔性特质体现,但柔性也同样影响结构的测定精度。冷冻电镜是进行结构解析的重要研究工具,而在处理冷冻电镜数据的过程中,由生物大分子结构柔性引起的构象多样性使得研究人员难以从单个样本中获取精确的三维模型。此外,冷冻电镜数据极低的信噪比也为深度学习算法在该领域的运用带来困难。OPUS-DSD算法基于深度学习设计,可有效地识别并处理生物大分子的柔性信息,从而提高冷冻电镜的解析能力,并获取生物大分子三维结构的动态变化信息。OPUS-DSD重构结构模型与传统冷冻电镜软件解析的模型对比。在虚线标示的区域中,OPUS-DSD重构的模型(绿色)比传统冷冻电镜软件解析的模型(紫红色)有更加完整的电子密度。这是因为OPUS-DSD能分开重构不同三维构象,而不会将其重叠在同一个三维模型中。OPUS-DSD解析的构象变化。绿色和古铜色分别代表OPUS-DSD解析的两个不同构象。在红色虚线框标识的区域,不同构象中的RNA链处在不同位置。 这显示了该RNA链处在动态运动中。 这种动态结构信息是很难用传统方法来提取和分辨的。
优良的数据处理智能算法对完全解锁硬件的研究工具属性至关重要,在硬件性能受限的情况下,智能算法可有效弥补算力不足造成的研究缺陷。OPUS-DSD具备优秀的数据处理能力和鲁棒性,能在更低信噪比的数据上保持较高的解析准确性。不仅可部署在单颗粒冷冻电镜,还可应用于更低信噪比的冷冻断层扫描电镜(Cryo-ET)中。研究人员表示,未来,当使用冷冻电镜解析生物大分子结构的研究时,是否运用先进数据处理算法,将对解析出的分子结构质量水平造成直接影响。
当前,绝大部分生物大分子,特别是超大型复合物的结构测定,仍然依赖实验结构测定技术,OPUS-DSD针对冷冻电镜数据处理技术的重大突破,为实验测定提供了新范式。针对该项成果,诺贝尔化学奖得主迈克尔·莱维特(Michael Levitt)认为:“在结构生物学领域,解析生物大分子的柔性结构是一个长期目标。此次研究团队开发的新算法使科研人员能通过冷冻电子显微镜看到关键的结构细节,这是以往技术无法实现的,将对生物学、化学研究和药物发现产生重要影响。”联合团队负责人、上海AI实验室领军科学家、复旦大学复杂体系多尺度研究院院长马剑鹏教授表示,优秀算法的研究,难度极大,耗时漫长,需要研究人员有坐长期冷板凳的勇气。未来,团队将继续以人工智能为技术中枢,构建新一代生物体系分析工具与方法,解读生物遗传信息,加速生命科学在分子层面的研究,通过对蛋白质、核酸等生物大分子功能结构的预测与设计,为药物研发提供支持,支撑全链条AI赋能新药研发的先进技术平台。