查看原文
其他

深度解读,钱小红/秦伟捷团队合作报道,大规模尿液样本的糖基化组学分析新策略

Dr.Proteomics 精准医学与蛋白组学 2022-04-16

本文由景杰学术团队原创解读

欢迎点击上方蓝字“精准医学与蛋白组学”关注我们

并点击右上角“...”菜单,选择“设为星标"


O-糖基化修饰(O-GIcNAc)是一种动态可逆的、普遍存在的蛋白质翻译后修饰,广泛参与到诸如转录调控、细胞代谢、信号转导、蛋白降解等生物进程。糖基化蛋白通常位于细胞表面且容易分泌到循环系统中,具有作为疾病诊断生物标志物的巨大潜力。

近日,来自国家蛋白质科学中心( 北京)、中国军事科学院军事医学研究院生命组学研究所钱小红团队、秦伟捷团队合作,发表了一种新的集成数据处理策略,基于参考库的MS1特征匹配和MS2识别传播,可快速识别、高深度和可重现的无标记的人类尿液O-糖基化定量蛋白质。这种策略将数据库搜索速度提高了20倍,并使单个样品中完整O-糖肽定量提高了30%-40%,重现性明显提高。

 
运用该集成数据处理策略,作者共在36个健康的人类尿液样本中鉴定出1300个完整的O-糖肽,缺失数据量减少了30%-40%。这是目前尿O-糖蛋白组学的最大数据集,证明了这种新策略在大规模临床研究中的应用潜力。相关研究成果发表在专业学术期刊Analytical Chemistry上。

尿液样本糖基化组学分析流程图

糖基化作为最复杂的蛋白质翻译后修饰之一,蛋白质组中丝氨酸和苏氨酸残基的广泛存在,以及数十种不同的O-聚糖类型,导致糖基化的数据库搜索需要非常长的时间。搜索典型的尿液O-糖蛋白组的原始MS文件包含120多个MS2谱图,需要花费120多个小时,即使将O-糖肽谱图整理出来,仍需要60个小时。除此之外,由于完整的O-糖肽的丰度低且离子化差,并且依赖于数据的MS2采集具有随机性,因此随着样品数量的增加,不可避免地会缺少大量数据,这破坏了样品之间的定量比较。这些因素的结合,是大型临床人群O-糖蛋白组学研究面临的挑战。

一、新集成数据处理策略,极大缩短数据库搜索时间

为了方便在大型队列中进行O-糖蛋白组学分析,作者提出了一种新的糖亚组特定数据库搜索策略,其中分类出的含唾液酸(SA)谱图和非唾液酸(non-SA)分别针对相应的SA和非SA聚糖数据库搜索质谱图。在这种策略中,通过筛选HexNAc的常见诊断碎片离子,从原始数据文件中首先对完整的O-糖肽谱图进行分类,然后根据特征的存在/不存在,将其进一步分为SA和非SA亚组。接下来,Byonic软件的内置聚糖数据库中的70个聚糖被分为SA(27种糖形式)和非SA(43种糖形式)聚糖数据库。以这种方式,仅针对聚糖数据库中的相应亚组搜索完整O-糖肽的每个谱图亚组。

作为概念证明,作者使用了包含26313、26713和24776个谱图的三个原始MS文件作为模型样本。对于完整的O-糖肽搜索,Byonic软件的聚糖数据库中的每个糖型均被视为MS2谱图数据库搜索的可变修饰。如图1所示,仅将O-糖肽谱图进行分类就可以将搜索时间减少一半。但是,将谱图分为SA组和非SA组并搜索由特定糖型组成的相应聚糖数据库后,搜索时间减少了20倍。数据库搜索所需的时间从> 120 h(使用所有MS2质谱图)减少到60 h(使用O-糖肽谱图),最后通过使用作者的糖型特异性策略进行数据库搜索,最终降至6 h。明显减少的数据库搜索时间,使得在大范围的人群中进行O-糖蛋白组分析成为可能。

图1、使用不同策略的数据库搜索时间

二、建立参考库,提高定量重现性

接下来,研究者运用新的糖型特异性数据库搜索策略,共获得了16个男性和20个女性尿液样品(样本策略)的O-糖蛋白组(质谱策略),每个原始MS文件的平均处理时间为6小时,研究总共鉴定出1300个完整的O-糖肽,对应于435个O-糖蛋白。

由于完整的O-糖肽的丰度低且离子化不佳,对36个尿液样品进行基于DDA的MS2采集会导致了定量重现性较差,初始缺失值为65.5%。为了解决这个问题,他们使用已鉴定的O-糖肽数据集的MS1功能和MS2谱图建立了参考库。经过特征匹配、谱图传播和后处理质量控制后,成功地估算出几乎一半的缺失值(图2)在插补后,缺失值从65.6%降低到34.1%,获得更全面和可靠的尿液O-糖蛋白组动态范围,这可以有效促进不同尿液样本之间的大规模定量比较。

2集成数据处理策略在人类尿液O-糖肽分析中的应用
(a) 36份人类尿液样本中缺失数据(显示为空白)和MS2识别的O-糖肽(显示为蓝色)的分布。(b) O-糖肽的输入缺失数据(红色显示)的分布

三、尿液O-糖蛋白组分析发现性别相关的差异

作者使用该策略估算缺失的O-糖肽并对36个尿液O-糖蛋白数据进行无标签定量比较(男性20例,女性16例)。结果表明,男性和女性组中23种蛋白质上的30种O-糖肽在静态上不同。这种差异在36个个体的尿液O-糖蛋白组的热图中更清楚地显示出来,其中12个O-糖肽在男性中没有明显调节,而其余18个被显著下调(图4下)。最近报道了几种性别相关的尿蛋白,但在这项工作中首次发现是糖蛋白。最新的尿液蛋白质组分析表明,性别是导致尿蛋白组个体差异的关键因素,本文的研究结果也佐证了这一观点。这表明性别相关的差异可能是导致尿液蛋白质组中个体差异的共同特征,在未来的生物标志物筛选中必须考虑这些差异

图3、尿液O-糖肽在男性组和女性组之间区别的热图

综上所述,在这项工作中,作者开发了一个集成的MS数据处理策略,包括糖类特异性数据库搜索、基于参考库的MS1特征匹配和MS2识别传播。作为概念证明,该策略能够在36份尿液样本中对完整的O-糖肽进行稳健的定量比较,使用合理的时间,而无需在每个样本中识别MS2。为进一步阐明O-糖蛋白组在疾病发生发展中的作用,有望在临床研究中应用于处理大量的O-糖蛋白组队列数据集。

参考文献
Zhao Xinyuan, et al., 2019, An Integrated Mass Spectroscopy Data Processing Strategy for Fast Identification, In-Depth, and Reproducible Quantification of Protein O-Glycosylation in a Large Cohort of Human Urine Samples. Analytical Chemistry.

本文由景杰学术团队原创,欢迎转发到朋友圈。如有转载、投稿、等其他合作需求,请添加微信ptm-market咨询。

往期精彩回顾




4D蛋白质组学:重磅!Matthias Mann发文,基于捕获离子淌度的新一代4D 蛋白质组学
尿液+蛋白组:Hypertension:尿液蛋白质组学预测螺内酯对高血压患者的临床反应
尿液+蛋白组:男女异同?研究发现性别为尿液蛋白质组个体差异的关键因素
尿液蛋白标志物:MCP:蛋白组学鉴定膀胱尿路上皮癌尿细胞学检测的诊断标记物
石蜡切片+蛋白组:抢“鲜”领略,Matthias Mann团队发表大规模FFPE样本的蛋白质组学分析方法
血液+蛋白组:专家评述 | 浙大一附院李兰娟院士团队基于血液蛋白质组学开发慢加急性肝衰竭精准诊断蛋白标志物组合
外泌体+精液蛋白组:世界艾滋病日 | 蛋白组学为“艾”发声,揭示HIV感染后,血液/精液外泌体组成的“危险”变化
癌症组织样本:Nature | 整合蛋白质组学研究揭示“癌症之王”治疗新靶点



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存