Nature重磅：100个物种的蛋白质全景图，高通量蛋白组技术最新力作！

Original 景杰学术精准医学与蛋白组学 2022-04-17

收录于话题 #蛋白质组学CNS精选 32个

景杰学术| 报道

蛋白质是生命功能的执行者，但由于技术的局限性，人们对蛋白质图谱的理解还远远不足。随着质谱技术的发展，人们已经完成了多个物种（包括人类）的蛋白质组图谱分析。然而，在跨物种的蛋白质组比较分析方面仍然缺少系统性的研究。

2020年6月17日，国际著名蛋白质组学家、马克斯普朗克生物化学研究所所长Matthias Mann 教授团队在国际著名期刊Nature发表题为“The proteome landscape of the kingdoms of life”的文章。文章中，研究人员使用先进的蛋白质组学工作流程深入研究100个不同类别的生物体，以标准化的方式获得了200万个肽和34万个蛋白质的鉴定，为生命科学以及基于序列的机器学习提供了一个大规模的研究案例。

文章速读

1、跨生命树蛋白质组学工作流程图

为了在生命树中收集各类具有代表性的生物，研究人员考虑了组装基因组序列的可用性和培养或组织材料的可及性等因素，选择了包括19个古生菌，49个细菌和32个真核生物——总共100个不同的物种（样本策略）进行后续的蛋白组学研究。研究人员将最新的技术纳入了高分辨率、高通量的蛋白质组学工作流程（质谱策略）。该流程采用芯片形式的小型、高效的UHPLC装置进行分离。在该装置中，C₁₈覆盖的珠子被均匀有序、静态固定的微米大小的柱状结构取代，显著提升了肽段保留时间的变异系数和实验的重现性。

2、应用深度学习模型预测肽段保留时间

深度学习的算法为质谱数据的匹配搜库提供了新的思路和应用，而这项关于100个物种、超过200万个肽段的大规模分析非常适合于发展深度学习算法。作者开发了一个long short-term memory (LSTM)的深度学习模型来准确预测色谱保留时间,并实现皮尔逊相关性0.990。为了验证该模型的可靠性，研究人员应用质谱仪对均变杆菌、巨大芽孢杆菌或产气肠杆菌三个未知蛋白组的物种进行分析，结果显示其能够符合绝大多数（约88%）的蛋白质组数据，表明这个算法是成功和准确的。

3、蛋白质组学数据全局分析

与基因组学和转录组学不同，蛋白质组数据可以直接估计基因表达的最终产物。接下来，研究人人员进一步探究蛋白质在不同生物体内是如何分布的。跨物种分析中，作者专门挑选了高丰度的蛋白进行分析（因为这些蛋白功能较为保守和基础），其中真核生物有1546个蛋白质，细菌中有306个，古菌中有262个。随后，研究人员把相应蛋白质和肽段信息同各种数据源的数据相关联，产生一个多于800万个节点的网络结构图和多于5380万的作用关系。进一步的分析发现，某些种类的蛋白质只在特定的生命分支中占优势，比如与光合作用相关的蛋白质只存在于光合自养生物体中，如植物、藻类、原生动物或蓝藻细菌(100个生物体中的13个)。

通过对生命分类学的取样，研究人员创建了一套高覆盖率蛋白质组质谱数据。非标（label-free）定量使我们能够推断出共同的和专门的生物功能，并将它们与所有分类层次的近亲和远亲进行比较。蛋白组与基因组、代谢组和其他数据的整合，以及将机器学习方法纳入特定物种库，将把系统生物学的视角从模式生物体扩展到整个生命树。

此项研究结果为整个进化范围内生物的功能组织研究提供了一个重要的信息。在所有检测到的蛋白质中，有38.4%的蛋白是没有功能注释的，其中还包括不少高丰度的蛋白。发现这些“dark proteome”的功能，将是非常吸引人的新研究方向。此外，蛋白质修饰也是蛋白质组的重要层面，本文中虽然没有对修饰进行特殊富集，但仍然尝试从有限信息中进行搜索和展示了部分的修饰位点。未来通过富集的手段进行更大规模的修饰组分析，将是全蛋白质组图谱研究的另一个重要方向。

参考文献：

1、Johannes B. Müller, et al., 2020,The proteome landscape of the kingdoms of life. Nature.

2020年CNS阅读：2020.05：Cell封面文章：跑步短短10分钟，身体近10000个分子大变样！蛋白组学破解运动有益健康之谜2020.05：Cell重磅 | 西湖大学郭天南团队发现新冠重症患者重要生物标志物2020.05：Nature：蛋白质组学研究揭示新冠治疗靶标，可显著抑制病毒复制！2020.04：新冠防治迎重要进展，69个“老药”有望“新用”，Nature发布大型SARS-CoV-2蛋白互作图谱2020.03：“三月春华红似火”, Nature | 整合组学分析绘制最全面的拟南芥蛋白、修饰与互作图谱2020.03：Cell重磅！组织特异性的蛋白质氧化还原修饰，或将提供衰老研究新思路2020.02：2020开年红！Cell | 贝勒医学院章冰/西北太平洋国家实验室刘涛等解析子宫内膜癌蛋白质组学图谱2020.01：癌症研究新篇章，Cell | 高深度蛋白质组学补全「癌细胞系百科全书」

本文由景杰学术团队报道，欢迎转发到朋友圈。如有转载、投稿、等其他合作需求，请文章下方留言，或添加微信ptm-market咨询。

▼▼▼ 点击查看原文

高三女生醉酒后被强奸致死？检方回应

高三女生醉酒后被强奸致死？检方回应

波罗的海，电缆断裂！

川普的成长秘辛：家庭和大学如何塑造一位“坚刚不可夺其志”的总统

萝莉岛事件背后所隐藏的真相，可能比我们想象的更恐怖

Nature重磅：100个物种的蛋白质全景图，高通量蛋白组技术最新力作！

您可能也对以下帖子感兴趣

高三女生醉酒后被强奸致死？检方回应

高三女生醉酒后被强奸致死？检方回应

波罗的海，电缆断裂！

川普的成长秘辛：家庭和大学如何塑造一位“坚刚不可夺其志”的总统

萝莉岛事件背后所隐藏的真相，可能比我们想象的更恐怖

生成图片，分享到微信朋友圈

Nature重磅：100个物种的蛋白质全景图，高通量蛋白组技术最新力作！

您可能也对以下帖子感兴趣