综述 | Mass Spectrom. Rev.:定量蛋白质组学的化学同位素标记
编译:微科盟-红烧大肥鸥,编辑:微科盟Emma、江舜尧。
微科盟原创微文,欢迎转发转载。
导读在过去的几十年里,液相色谱和质谱的进步推动了基于质谱的蛋白质组定量方法的重大发展。多重同位素标记策略极具吸引力,它在数据依赖的采集模式下显著提高了定量蛋白质组学的准确性、精密度和通量。基于同位素标记的方法可分为基于MS1和MS2的定量方式。本文对基于化学同位素标记的方法进行了综述,并讨论了它们的原理、优点和局限性,以期深入了解定量蛋白质组学的基本问题,为定量蛋白质组学方法的选择提供有益的参考。作为一种观点,我们讨论了当前用于数据独立采集模式的多重同位素标记方法的可能性和局限性,这种模式正变得越来越流行。
论文ID
原名:Chemical isotope labelingfor quantitative proteomics译名:定量蛋白质组学的化学同位素标记
期刊:MASS SPECTROMETRY REVIEWSIF:10.946发表时间:2021.05通讯作者:田晓波
通讯作者单位:荷兰格罗宁根大学药学研究所分析生物化学系质谱中心
主要内容
1. 前言
蛋白质组学的目的是对生物系统中的所有蛋白质进行全面的鉴定和定量,以揭示蛋白质在生物、生理和病理过程中的作用。蛋白质组学数据质量在准确度和精确度方面不断提高,同时通量也在增加,导致数据流量不断增加。这是由于液相色谱-质谱(LC-MS)的速度、灵敏度和分辨率的提高,以及在数据处理方面得益于计算能力的提高和先进算法的进步。蛋白质组学在许多研究领域都有广泛的应用,如生物机制的探索、生物标志物的发现以及药物设计等。基于LC-MS的蛋白质组学中最广泛使用的策略是自下而上的蛋白质组学,即蛋白质首先被水解成多肽,这些肽通常通过反相高效液相色谱(RP-HPLC)分离。多肽的质量是在MS1水平上确定的,而相应的碎片离子是碰撞池中破碎后在MS2水平上获得的。人们通过将MS1中测定的母离子和MS2中的碎片离子与相应蛋白质序列酶切产生的理论质量进行匹配,可以鉴定出样品中的肽,并利用这些信息将肽分配给相应的蛋白质,从而实现对它们的鉴定和定量。一种不太广泛使用的策略是自上而下的蛋白质组学,它代表通过质谱直接分析完整的蛋白质。有关这种方法的详细信息,我们建议读者参考Kelleher和他的同事的评论。
随着蛋白质组学研究的进展,越来越清楚的是,定量信息对于将蛋白质组学数据与可操作的结果(如药物设计或基于生物标志物的诊断方法开发)联系在一起是至关重要的。准确量化动态变化的蛋白质组成是理解生物系统功能的基础。根据是否使用同位素标记,现有的基于质谱的蛋白质组定量方法可分为(I)无标记蛋白质组学和(II)基于标记的蛋白质组学,又称多重定量蛋白质组学。本文重点介绍了基于标记的蛋白质组学,特别是化学标记,并对无标记蛋白质组学作了简要介绍。
1.1 无标记蛋白质组学
下面我们将讨论无标记蛋白质组学的代表性特征,读者可参阅完整的综述以了解更多细节。鉴于无标记方法不需要用同位素标记衍生化,可以在任何类型的质谱仪上实现,由于仪器重现性的改善和先进的数据采集和数据处理方案,它得到了广泛的应用,并取得了良好的效果。然而,无标记蛋白质组学在通量方面都有固有的局限性,因为它在每次LC-MS运行中只分析一个样品,且在精确度方面它不能校正分析的变异性。例如,人们通常通过比较MS1水平上的前体离子的峰面积或通过计数每个肽的MS2光谱的数目来实现相对定量。因此,在连续进样的过程中,定量结果很容易受到保留时间漂移、电离效率和样品损耗的影响。为了避免或减轻这些缺陷,多个样品的同时分析是一种很好的补救方法,但它必须能区分质谱仪中包含相同序列的差异标记肽方法,同时最小程度地影响它们的物理化学性质,以最大限度地减少样品制备过程中保留时间的偏移或可变回收率。因此,稳定同位素标记是一个理想的选择,因为同位素具有几乎相同的物理化学性质且具有不同的质量。
1.2 基于标记的蛋白质组学
蛋白质组学中的多路复用技术于1999年首次引入,包括同位素编码亲和标签(iCAT)和15N代谢标记法。此后,又出现了一系列多重定量方法,包括细胞培养中氨基酸稳定同位素标记(SILAC)、相对和绝对定量等重标记(iTRAQ)、串联质量标记(TMT)和等重肽末端标记(IPTL)。所有这些方法都利用不同的同位素标记来衍生来自不同样品的多肽或蛋白质。大多数方法涉及蛋白水解肽的衍生化,而不是完整蛋白质的衍生化,因为每个蛋白水解肽至少包含一个合适的标记位点,即伯胺基团,从而允许使用相同的策略标记样品中的所有肽。由于差异标记的多肽可以通过质谱进行解析,并且标记的样品在LC-MS之前被混合在一起,因此可以实现多个样品的同时分析,这避免了由于工作过程中可变的样品损失和注射之间的电离效率改变等引起的信号变化。多路复用方法有望提供更好的定量精度和更高的通量,从而减少每个样本的总体分析时间。常用的重同位素有13C、15N、18O和2H。2H不常使用的原因是因为用不同数量的氘原子修饰同一个肽会引起LC保留时间发生变化,这是由于氢/氘与反相固定相之间的差异作用造成的,因为氘的质量比氢大,振动幅度比氢小。因此,尽管基于氘的标记可以进一步扩展多路复用容量,但大多数化学标记方法使用13C和15N。
大量的多路复用方法被报道,它们可以根据不同的标准进行分类,如图1所示:(I)根据肽的定量阶段,它们可以被分类为基于MS1的定量(例如ICAT和mTRAQ)和基于MS2的定量(例如TMT和iTRAQ);(II)根据来自不同样品的相同多肽在同位素标记后是否具有相同的质量,可将其分为基于等重标记的定量(TMT、IPTL和EASI Tag)或基于同位素标记的定量(ICAT和m-pIDL);(III)根据加入同位素的方法,它们可分为基于化学标记的定量(例如ICAT和TMT)和基于酶标记的定量。(IV)基于是否需要超高分辨率来区分MS1或MS2级别的mDa质量差异,它们可以细分为不需要超高分辨率的标签(例如,ICAT和4-plex iTRAQ)、需要在MS1级别的超高分辨率的标签(DipyrO和mdDiLeu)以及需要在MS2级别的超高分辨率的标签(11-plex TMT和21-plex Dileu)。值得注意的是,这些分类基于不同的标准(表1)且并不是相互排斥的。尽管一些标签,如4-plex iTRAQ和DiLeu,不具有严格意义上相同的前体质量,但它们被归类为等重,因为在MS1水平上母离子质量的mDa差异没有用于区分不同的标记通道。在这篇综述中,我们将重点介绍基于化学标记的定量蛋白质组学方法,即用不同的同位素标记蛋白水解肽,然后将标记的样品汇集在一起,在一次LC-MS运行中进行分析。
图1 基于MS1和基于MS2的定量示意图概述
表1 基于不同标准的化学同位素标记方法分类
a. 尽管iTRAQ和DiLeu系列标记物在前体质量中具有mDa差异,但它们被归类为等重的,因为在一般使用的MS1水平上并不区分mDa差异,并且它们已经习惯性地被认为是等重的。
1.3 数据采集策略
在讨论具体的标记策略之前,本文有必要介绍两种主要的MS2质谱采集模式,即数据依赖性采集(DDA)和数据非依赖性采集(DIA),因为它们与多路量化方法的优缺点密切相关。在大多数多路复用方法中,MS2谱图的采集是以DDA模式进行的,在DDA模式中,LC-MS运行期间按强度递减的顺序逐个选择一定数量的母离子用于碎裂。产生的碎片离子呈现在离散的MS2谱图中,从而在前体离子和它的碎片之间提供了直接的联系。因此,DDA偏重于高丰度的化合物种类,限制了对低丰度肽和最终蛋白的鉴定(图2)。可分离色谱峰的数量随着质谱仪的扫描速率而增加,但是MS1谱图中的峰通常比仪器在分析时间范围内能够分离的峰多(通常是LC峰的宽度),导致次峰被忽略。这个问题随着样品复杂性的增加而增加,并进一步与色谱分离的分辨率有关,导致高复杂性样品在最终的LC-MS分析之前通常必须进行分离,这增加了每个样品的分析时间。此外,DDA模式中前体离子选择的随机性降低了每次运行的重现性,通常会导致所谓的“失真问题”,这意味着在每次LC-MS运行中可能不能检测到(碎裂)给定的肽;这给比较数据分析带来了困难。为了对DDA中的前体离子进行更全面的采样,已经开发了各种方法。动态排除是一种常用的策略,用来防止一个肽在洗脱色谱峰的时间范围内触发多个MS2事件,因为这会将时间花在潜在已鉴定的肽上,而其他肽则逃避分析。尽管有这些限制,DDA仍然是目前发现蛋白质组学中使用最广泛的数据获取策略,因为成熟的数据获取和数据处理流程几乎可以在任何MS仪器上实现。
图2 DDA和DIA模式的MS1隔离窗口不同
DDA,数据依赖性采集;DIA,数据非依赖性采集
与DDA相反,DIA中碎裂前体的分离不依赖于MS1中的峰值强度。相反,存在于预定义分离窗口内的所有前体都将被碎片化并一起分析,如图2所示。DIA在很大程度上解决了缺失值的问题,代价是失去了前体离子和碎片离子之间的直接联系。DIA的MS2谱本质上更为复杂,因为来自多个共分离的前体离子的碎片离子存在于相同的MS2谱中,这使得分析DIA数据比DDA数据更具挑战性。自从提出连续窗口获取所有理论碎片离子质谱(SWATH-MS)以来,DIA近年来随着复杂数据处理算法的发展取得了显著进展。同样值得注意的是,MS1和MS2数据均可用于DIA模式下的定量。稳定同位素标记技术在DDA模式中应用广泛,但在DIA中的应用尚处于起步阶段。因此,在本综述的最后,我们将重点介绍DIA模式下应用稳定同位素标记的最新进展、优势和挑战。
2. 基于MS1的定量
基于MS1的定量方法是通过同位素标记使多肽的质量增加,从而使来自不同样品的相同多肽具有不同的质量。定量是通过比较MS1水平上每个标记通道的肽离子的峰面积或强度来实现的。随后,肽水平的定量信息需要转移到蛋白质水平,这是DDA和DIA面临的共同挑战。通常,至少4 Da的质量位移被合并到同位素标签中,以避免轻标记或重标记样品的同位素重叠。较小的质量位移(<4 Da)导致的重叠使得差异标记的肽簇间相对定量变得更加困难,因为需要额外的解卷积步骤。这对于含有氘的标记物来说尤其具有挑战性,因为它会引起保留时间的轻微变化。
用于MS1定量的不同同位素可以通过三种方法结合到样品中:(1)针对特定反应基团(胺或硫醇)合成的化学标记(例如ICAT和mTMT);(2)酶标记,在18O标记水的存在下蛋白质被酶消化,两个18O原子被结合到新形成的消化肽的C-末端羧基中;(3)代谢标记,如SILAC,不同的同位素标记氨基。在下面的讨论中,我们将重点介绍化学标记方法。有关基于酶标记和基于代谢标记的定量的深入讨论,我们请读者参考其他综述。
2.1 ICAT和cICAT标签
第一个报道的化学同位素标记标签是ICAT,它由三个功能部分组成,如图3所示:(1)生物素部分,可用于通过(Strept)亲和层析从消化混合物中富集ICAT标记的多肽;(2)同位素接头,它包含8个2H或1H原子,用于区分不同样品中的多肽;(3)碘乙酰胺基团,它与半胱氨酸侧链上的巯基发生特异性反应。与无标记方法相比,ICAT的主要改进是能够在一次LC-MS运行中基于包含至少一个半胱氨酸的多肽子集同时定量两个样品,这在保持鉴定覆盖率的同时降低了样品的复杂性,因为尽管半胱氨酸是一种相当罕见的氨基酸,但大多数蛋白质都含有至少一个半胱氨酸残基。虽然ICAT的优点是显而易见的,但几个局限性很快就暴露了出来:首先,与含有1H的肽相比,连接子中使用的2H原子改变了保留时间。第二,由于不可分配的碎片离子,在生物素部分发生碎裂,对肽的鉴定产生不利影响。第三,由于ICAT的质量很大,标记的肽可能会偏离检测的最佳m/z范围,特别是当一个肽中包含多个标签时。尽管存在这些局限性,ICAT被广泛认为是以化学标记为基础的同位素标记定量蛋白质组学的先驱。随后,一种可裂解的ICAT(cICAT)被提出,它允许在LC-MS之前酸性pH条件下去除生物素部分,从而减少肽断裂的问题。此外,用13C取代2H可确保反相色谱过程中差异标记多肽的洗脱。然而,cICAT对半胱氨酸的特异性仍然是一把双刃剑。它降低了蛋白质组样本的复杂性,允许对含有半胱氨酸的多肽子集进行更详细的分析,同时遗漏了无半胱氨酸多肽的所有信息。
图3 2-plexICAT的结构设计和同位素分布
ICAT:同位素编码亲和标签
2.2 二甲基化作用
于2003年首次提出的二甲基化是一种简单而经济的化学标记策略。它基于还原胺化反应原理,其中肽/蛋白质的N-端胺基和赖氨酸残基侧链上的胺基与甲醛反应,甲醛以12C1H2O、13C1H2O、12C2H2O和13C2H2O的形式存在,然后用氰化硼氢化钠(以NaB1H3CN和NaB2H3CN存在)还原。如图4所示,通过不同同位素形式的组合,双甲基化可以实现双链或三链标记。通过将12C1H2O与NaB1H3CN结合,12C2H2O与NaB1H3CN结合,13C2H2O与NaB2H3CN结合,可实现“轻、中、重”的三链标记,每个衍生位点的质量位移为4 Da。双甲基化不是像ICAT中的Cys那样标记一种稀有的氨基酸,而是在几乎所有蛋白水解肽中都存在的胺基上进行同位素标记,从而能够在更复杂的肽混合物中鉴定和定量蛋白质。二甲基化提高了肽的电离效率,因为生成的叔胺在电喷雾中更容易电离,并改善了b离子系列的完整性。另一个有趣的现象是与ICAT中观察到的多肽相比,用不同数量的氘原子对多肽进行差异化二甲基化,多肽表现出较小的保留时间漂移。据推测,与ICAT标记的乙二醇连接物相比,亲水性三甲胺基团上的氘原子与反相固定相的相互作用较小。选择性N-端二甲基化是二甲基化的一种适应性反应,它利用了N-端胺基和赖氨酸侧链上的胺基之间的PKA差异。二乙基化使用了与二甲基化相同的标记原理,但用乙醛取代甲醛,从而提供了更高的多路复用容量。最近有报道,与基于氘的三联二甲基化方法相比,基于13C的三联二乙基化方法具有更好的定量准确度和精密度,这主要是因为氘对保留时间有影响。
图4 带有C-末端赖氨酸残基的多肽三链二甲基化
甲醛中的13C用星号标出
2.3 同位素编码蛋白标签(ICPL)、mTRAQ和mTMT标签
ICPL于2005年首次引入。该标签含有一个电离效率较好的吡啶环和一个N-羟基琥珀酰亚胺(NHS)酯,可对赖氨酸的N-末端ɑ-胺基和ε-胺基进行有效标记。在最初版本的ICPL方法(图5)中,“轻标签(+0)”吡啶环上的1H原子被2H取代以生成“重标签(+4)”,从而允许进行双重实验。为了避免氘效应引起的保留时间漂移,人们开发出另一种含13C的ICPL。在最初的ICPL工作流程中,样品在蛋白质水平上进行标记,从而避免了因酶解效率不同而导致的比例偏差和酶解过程中的样品丢失。然而,这一策略也有缺点,即只有60%-70%的鉴定蛋白可被定量,这可能是因为并不是所有鉴定的肽都含有ICPL标签,因为并不是所有的伯胺在完整的蛋白质中都是同样容易获得的。到目前为止,最常见的是方式在酶解后进行ICPL标记,因为每个蛋白水解肽在N端至少含有一个胺基。因此,每个肽都可被定量,这显著提高了ICPL的蛋白定量比例(98%)。
图5 2-plex ICPL、3- plex mTRAQ和2- plex mTMT标签的结构和同位素分布
mTRAQ标记于2010年首次用于蛋白质组学的完整相对定量。如图5所示,mTRAQ结构中的叔胺有三种同位素形式(+0,+4和+8)可高效电离,从而使每个衍生位点的质量位移分别为140、144、148 Da。2019年提出的mTMT标签与随后讨论的等重TMT标签具有相同的化学结构。最初TMTzero (TMT0)和“超重”TMT(ShTMT)标签被用来区分标记质量相差11 Da的两个样品(图5)。mTRAQ和mTMT都具有胺反应性的NHS酯,能够有效地标记多肽中的伯胺基团。这两种标签在重标签中只使用15N和13C原子。
2.4 中子编码同位素标记
中子编码通过掺入2H、13C或15N同位素而获得的mDa质量差来定量多肽(见图6),这扩展了基于MS1和MS2的定量蛋白质组学中化学和代谢标记策略的多路复用可能性。基于MS1的定量方法通常在标记通道之间使用至少4 Da的质量间隔,以避免差异标记肽同位素之间的重叠。然而,该间距限制了可以添加的同位素数量,从而限制了多路复用容量。受增加复用容量的启发,Hebert等人在等重标签8-plex TMT中通过中子编码获得的mDa差值来增加复用容量。2013年首次引入中子编码作为一种基于MS1的量化方法,用于细胞培养中氨基酸的代谢标记。在那份报告中,他们设计了NeuCode SILAC,它通过使用两种赖氨酸来实现多重标记,一种含有6个13C和2个15N原子(“Heavy 1”,+8.0142 Da),另一种含有8个2H原子(“Heavy 2”,+8.0502 Da),用于酵母蛋白的代谢标记。与未标记的赖氨酸相比,两种同位素标记的赖氨酸都有约8 Da的质量增加,在200K以上的分辨率下,36 mDa的微小质量差可以在MS1水平上被分辨出来,这可在傅立叶变换离子回旋共振(FT-ICR)和最新的Orbitrap质谱仪上可以实现的。这些质谱仪应用了包括三个部分的扫描方式:(1)用于定量的高分辨率MS1扫描;(2)中等分辨率MS1扫描(其中mDa差异不可检测),并从中选择前体离子用于碎裂; (3)多个中等分辨率MS2扫描以产生用于肽鉴定的数据。这种方法最吸引人的特点是同一肽的前体离子对被分离并碎裂在一起,在低分辨率下产生难以区分的MS2光谱。以这种方式,MS1谱图的复杂性不会影响前体离子的选择,并且在同一窗口中选择同一多肽的轻与重形式。这有利于降低整个循环时间,并增加了从两个通道产生的重叠碎片离子强度,便于鉴定。两个因素决定了基于中子编码的方法的多路复用容量:(1)可用同位素的数量;(2)可获得的分辨率。考虑的同位素越多,所需的分辨率就越高。图7展示了通过添加4个新的Lys同位素(K#13C#2H#15N:K422、K521、K341和K440)所进行的6-plex中子编码的SILAC实验。
图6 基于中子编码的定量概念
13C和15N用星号标记。在m/z100-1000范围内,6.4 mDa质量差可以在高于240K的分辨率下分辨出来。峰值强度代表相对定量
图7 6-plex NeuCode SILAC 赖氨酸和 3-plex DiPyrO标签的结构和同位素分布
NeuCode法也已被应用于基于MS1的化学标记定量,该法使用通道之间具有12.6 mDa质量差的4-plex反应性乙酰基-精氨酸-(乙酰基)赖氨酸-甘氨酸-NHS标签中的13C和15N。然而,该标签的性能不是最理想的,所识别的肽的数量较少,可能是由于(1)标签体积大导致标签本身断裂,产生无序列信息的碎片离子;以及(2)将质子隔离在标签中的Arg残基上,限制了肽骨架的碎裂。为了避免这些问题,人们已经研究出各种中子编码的化学标签,这些标签更紧凑,更有利于肽的裂解,例如中子编码的氨基甲基化(图6)、mdDiLeu和DiPyrO。正如关于DiPyrO的工作(图7)所断言的那样,为了获得更高的多路复用容量,通常需要氘来构建标签,同时确保标签的紧凑性并可能会影响用不同数量氘原子标记同一肽的色谱保留。基于中子编码的定量方法可通过两种方式改进:(1)通过使用胺反应标签,用LysC而不是胰蛋白酶酶解,从而使所有肽结构上连接两个中子编码标签,这使得通道之间的质量差翻了一番,从而有效地降低了对分辨率的要求;(2)通过结合相同元素和不同元素的同位素之间的质量差异策略来提高复用容量。例如,乙酰基-精氨酸-(乙酰基)赖氨酸-甘氨酸-NHS标签通过将基于NeuCode的4-plex标记物进行三次复制而允许12-链标记:+0 Da(+0,+12.6,+25.2,+37.8 mDa),+4 Da(+0,+12.6,+25.2,+37.8 mDa),+8 Da(+0,+12.6,+25.2,+37.8 mDa),+8 Da(+0,+12.6,+25.2,+37.8 mDa)。总体而言,与传统的基于MS1的定量方法相比,中子编码的MS1方法在采样深度方面具有优势,因为避免了差异标记多肽的冗余MS2图谱,并且在多路复用容量方面具有优势。然而,它们在MS1级别需要非常高的分辨率,这会增加基于傅立叶变换的质谱仪的循环时间。
2.5 基于MS1的定量总结
总之,所有基于MS1的定量方法都具有在一次LC-MS中同时分析多个样品的共同优势。因此样品之间的相对定量是在同一次运行中进行的,而不是在不同的运行中进行,这提高了定量精度。复用容量通常受限于两个原因。首先,基于MS1的定量方法中的同位素标记使MS1光谱的复杂性与标记样本的数量成倍增加,因为来自不同样本的相同肽具有不同的质量。当使用DDA进行数据采集时,MS1复杂性的增加是一个缺点,因为在色谱峰的时间范围内只能选择有限数量的前体离子进行碎裂,导致对于复杂的样品,更多的峰被忽略。此外,丰富的多肽以多重形式出现,可能会被多次触发,这导致了相同多肽的冗余MS2谱,并消耗了宝贵的时间来从较低丰度的蛋白质中分离多肽。增加多路复用容量的第二个限制在于要求更多的原子传送同位素以及标记通道之间至少4 Da的质量位移,以防止同位素重叠。出于这两个原因,需要较大的同位素标签,这可能会对碎片性质产生负面影响,并导致识别率下降。中子编码方法在不干扰前体离子选择的情况下提高了多路复用容量。然而,它的可行性高度依赖于分辨率(>200k),需要最先进的FT-ICR或Orbitrap质谱分析仪。此外,由于受到标签的紧凑性限制,因此可以用13C/15N标记的位置数量有限,以及标签的商业可用性有限,基于中子编码的MS1标签目前没有得到广泛使用。此外,我们还向读者介绍了MS1标签在功能蛋白质组学研究中的其他有趣应用。
3. 基于MS2的定量
如上所述,基于MS1的定量具有多路复用容量,通常仅限于三重标记。然而,探索生物学问题通常需要在不同的时间点对多个条件下的蛋白质组进行定量比较,从而产生三个以上的样本。基于MS2的定量方法容易地实现更高的复用容量,而没有基于MS1定量方法中的大多数缺点。
基于MS2的定量通常依赖于用不同的同位素标记法标记来自不同样品的相同多肽。因此,差异标记的多肽具有相同的质量,这不仅避免了MS1光谱复杂性的增加,而且通过合并来自每个通道的信号来增加多肽离子的信号强度。同位素标记法进一步降低了从同一肽中获得冗余MS2光谱的风险。这使得等重标记与DDA采集模式高度兼容,在DDA采集模式下,在给定的时间窗口内只能分离一定数量的前体离子用于碎裂。除了基于碎片离子的定量变量外,不同样品的同位素标记肽产生相同序列衍生的肽骨架碎片离子,从而提供更好的信噪比和鉴定率。
在碎裂时,同位素标记肽为每个标记通道释放独特的定量离子,它们通常称为报告离子。这些离子的相对峰强度与相应的多肽水平成正比。通过比较定量离子的强度,人们可以从MS2谱图中提取相对定量的信息,MS2图谱通常比MS1具有更好的信噪比。大多数等重标签避免了基于氘的标记,因为包含相同序列差异标记肽的洗脱对于定量的准确性至关重要。根据定量离子的类型,当前的等重标记方法可分为三大类:(1)基于报告离子的定量(例如,TMT、iTRAQ),(2)基于肽碎片离子的定量(例如,IPTL、Ac-IPG)和(3)基于肽偶联报告离子的定量(例如,TMTc、EASI和Ac-AG)。
3.1 基于报告离子的定量
正如 Arul 和 Robinson所报道的那样,基于报告离子的定量是使用最广泛的基于等重标记的策略,包括 TMT、iTRAQ和DiLeu。基于报告离子的等重标记的结构设计由三个部分组成:(1) 报告基团部分,包含不同标记通道的不同质量,从而代表 MS2 中组成肽的定量信息,(2) 平衡基团,包含与报告离子互补的同位素,以确保等重标签的总质量相同,以及 (3) 一个反应基团,靶向肽上的特定官能团。
3.1.1 TMT和 iTRAQ标签
等重标记的概念最早是在2003年与2-plex TMT的原始版本一起提出的。它代表了继ICAT之后定量蛋白质组学的又一个突破。本文提出了6-胍基己酸-Met-Met-Gly-NHS和6-胍基己酸-Met-Pro-Met-Gly-NHS两种结构(图8)。脯氨酸残基N-末端的碎裂导致报告离子的形成,从而获得肽骨架和报告离子的碎片离子。2008年,人们报道了一种升级的6-plex TMT。与第一代TMT相比,6-Plex TMT的结构更加紧凑和优越,更有利于报告离子的形成。它通过中子编码进一步扩展到 10-plex标记。与所有最近的标记方法一样,它仅使用13C和15N同位素而避免使用氘(图8)。具有 6.3 mDa 最小质量位移的低质量报告离子可以通过质量分析器以50k的分辨率在m/z 100下进行区分。通过用13C取代每个12C,用15N取代每个14N,我们可以在6-plex TMT的化学骨架基础上得到18-plex。然而据推测,由于化学合成和试剂成本的限制,11-plex是目前该TMT设计的最高复用容量。在对更高的多路复用能力和可能更低的合成成本的需求的推动下,最近推出了一种基于16个脯氨酸的等重串联质量标签(TMTpro),它使用标记的脯氨酸作为报告离子,而不是二甲基哌啶,并加入两个β-丙氨酸残基作为平衡基团(图9)。在TMTpro标签中,人们加入9个重同位素(13C和15N),9个标签具有~1 Da质量位移,应用中子编码可以增加7个标签,质量差为6.3 mDa。
图8 具有报告离子、平衡基团和胺反应基团的等重标记物概念
碎裂发生在平衡基团和携带定量信息的报告离子之间。我们给出了具有代表性的原始2-Pex TMT、4-Pex iTRAQ和10-Pex TMT(中子编码)的同位素分布。对于10-plexTMT,13C和15N用星号标记
图9 16-plexTMTpro标签的结构和同位素分布
13C和15N用星号标记
在第一代双plex TMT发布后不久,人们报道了基于原始TMT标签的原理设计的4-plex iTRAQ(图8)。为了进一步提高多路复用能力,人们在8-plex iTRAQ的结构中加入了更大的平衡基团。然而,与4-复合体iTRAQ相比,蛋白质和肽的识别率较低,这可能是由于较大标签自身额外的内部碎裂导致生成序列信息不丰富的碎片离子。
在市面上可买到的基于报告离子的等重标签中,TMT系列近年来越来越受欢迎,这很可能是因为它不断发展的多路复用能力。
3.1.2 DiLeu, DiART, 和IBT 标签
由于iTRAQ和TMT标签需要复杂的多步合成,市面上已有几种替代性的等重标签,如N,N-二甲基亮氨酸(DiLeu)、氘等重胺反应标签(DiART)和等重标签(IBT)。
受到二甲基化肽中强a1离子的启发,xiang等人提出了以二甲基化亮氨酸为核心结构的4-plex DiLeu标签,如图10所示。本质上,DiLeu是基于MS1定量中广泛使用的二甲基化策略,适用于基于MS2的等重标记。据报道,与iTRAQ标记的肽相比,Dileu标记能更好地裂解肽骨架和生成强度更大的报告离子。Dileu标签只有几个碳或氮原子,因此人们也加入了氘标记以扩展多路复用容量,尽管氘标记会影响标记肽的保留时间。然而,氘原子放置在亲水性二甲胺基团中,这种影响被最小化,据推测,该基团与反相固定相的相互作用较小。虽然氘引起的保留时间漂移对这种等重标签是不利的,但不同同位素形式亮氨酸的可获得性、相当简单的合成和强度较大的报告离子使DiLeu成为TMT或iTRAQ的有价值的替代品。与TMT的发展类似,中子编码将DiLeu的多路复用容量从4-plex增加到12-plex (图10),且报告离子之间的质量差异很小,仅为5.8 mDa 。通过分步二甲基化和中子编码将报告离子之间的质量差进一步缩小到3 mDa,在不扩展标签紧凑结构的情况下,最近DiLeu的多路复用能力提高到21-plex。然而,分辨这种微小质量差异所需的分辨率从30k增加到60k( m/z为400 的Orbitrap质谱仪),因此需要更长的周期时间。不依赖于中子编码,人们已经设计了一些基于亮氨酸的二甲基化标签,它们通过加入更大的平衡基团来取代只能容纳两个同位素(13C和18O)的4-plex Dileu中的羰基,从而增加了多路复用容量。例如,6- plex DiART结合了β-丙氨酸,而8-plex DiLeu和10-plex IBT(图11)都使用丙氨酸作为二甲基化亮氨酸和胺反应基团之间的平衡基团。与4- plex或12- plex Dileu相比,8-Pex Dileu和DiART标记的多肽在标记通道之间表现出相当大的保留时间偏移,这是因为更亲水的氘被插入到平衡基(丙氨酸或β-丙氨酸)中,这对基于报告离子的等重标记构成了不利条件。作为同一主题的变量,DiAla 和 DiVal 标签也被合成并与 DiLeu 标签进行了比较。目前,除TMT外,IBT标签是唯一一个只使用13C和15N同位素实现10-plex标记的等重标签。
图10 4-plex和 12-plex DiLeu 的结构和同位素分布
4-plex DiLeu 由 115a、116c、117b 和 118d(以粗体标记)组成
图11 10-plex IBT的结构和同位素分布
3.1.3 报告离子标签的新颖设计与应用
除了上述基于报告离子的多肽相对定量方法外,人们还提出了新的概念和策略,为等重标签的进一步发展和更广泛的应用提供了蓝图。组合等重质量标签通过以下概念增加了多路复用容量,即每个等重标签产生两组彼此独立的报告离子,并且可以从不同报告离子的组合中推断出定量信息(图12)。虽然仅显示了6-plex标记的结果,但作者预计16-plex标记的报告离子间质量偏移约为 1 Da,而使用质量偏移约为 6 mDa 的28-plex标记容量只有五种重同位素。然而,作者指出,报告离子的形成受到前体肽上是否存在可移动质子的预测的影响。尽管该标签的结构还有改进的空间,但组合定量的概念有望提高定量蛋白质组学的多路复用容量。
图12 CMT 和报告离子的结构
6 -plex CMT 的同位素分布和报告离子解卷积原理;13 C 和15 N 标有星号
另一方面,人们报道了一系列针对特定亚类多肽或蛋白质的定量方法(图13),即可切割的等重标记亲和标签(半胱氨酸残基的cysTMT标记,以及GlycoTMT标记和GlycoTMT标记),其中包含靶向通过氧化产生的邻醌的硫醇基团。上述标记针对伯胺基团以外的特定残基或反应位点,例如针对带有碘乙酰胺类似物的半胱氨酸残基的巯基的cysTMT或针对带有氨氧基类似物的多糖醛的GlycoTMT。这对于研究翻译后修饰(PTM)特别有用,因为含有PTM的肽通常丰度较低,而且MS检测需要大量的起始材料。因此,当使用标准等重标签来分析PTM时,人们需要大量的标签来完成标记。
图13 基于TMT或iTRAQ的标记用于研究糖基化蛋白质和含有反应性氨基酸衍生物、酪氨酸氧化残基中的邻醌和半胱氨酸残基中的巯基蛋白质的例子
3.1.4 校正比率失真的策略
尽管基于报告离子的定量方法由于其多路复用容量和针对不同官能团的灵活标记能力而显示出优异的通量,但越来越明显的是,基于报告离子的定量受到肽共碎裂引起的比率失真的影响,如图14所示。DDA模式下的数据采集通常利用几个Thomson(Th)的窗口来分离前体离子以进行碎裂。虽然单个前体离子的分离和裂解产生了明确的MS2光谱,其中报告离子的比率反映了不同标记样品中给定肽的比率,但当具有相似保留时间和小于分离窗口的质量差的不同肽的前体离子被共隔离时,情况就不再是这样了。因此,不同多肽产生的报告离子难以区分,它们的强度不再反映不同样品中多肽之间的比例,从而导致不正确的蛋白质比例。对于更复杂的样品,这一问题更为严重,并进一步取决于色谱分离的效率。虽然通常只有一小部分肽和蛋白质受到影响,但比率失真降低了整个分析的可靠性,因为它以一种不可预测的方式影响蛋白质比率。在过去的十年中,人们报道了许多解决比率失真问题的方法。它们可分为以下几类:(1)结合预分离来扩展LC梯度;(2)缩小前体分离窗口;(3)LC峰顶的延迟碎裂;(4)附加的气相反应;(5)使初级碎片离子经历额外的分离和MS3碎裂步骤;(6)离子迁移以分离洗脱肽; (7)通过估计干扰程度或通过检测和丢弃从多个前体产生的MS2光谱来校正比率失真。
图14 多肽前体离子共碎裂引起的比值畸变
根据Ting和Wenger等人的说法,预分离和缩小分离窗口仅在有限程度上减少了比率失真的问题。这表明,在鸟枪式蛋白质组学中,我们仍然只触及肽混合物的表面深度。Orbitrap仪器上的延迟碎裂方案与缩小的隔离窗口相结合,可将比率失真降低32%,因为碎裂被触发得更接近色谱峰的峰顶。这在一定程度上避免了共碎裂,并提供了更好的信噪比,从而获得了更高质量的MS2谱。通过所谓的QuantMode方法中的质子转移离子-离子反应来降低肽的平均电荷会增加肽之间的m/z差异,从而降低了共碎裂的可能性,例如通过避免双电荷前体离子和另一个三电荷前体离子之间的干扰。然而,这种方法没有被广泛使用,因为它依赖于难以优化和控制并且需要高级仪器的扫描程序。
在最初报道的基于MS3的校正比率失真的方法中,人们选择MS2光谱中最强的碎片离子进行进一步碎裂。由于前体的b和y离子也不太可能重叠,因此产生的报告离子不太容易受到比率失真的影响。受限于仅分离一个碎片离子用于二次碎裂,第一代基于MS3的方法在MS3光谱中受到中等强度的报告离子的影响。有鉴于此,改进的多点MS3方法可同时分离多个碎片离子进行二次碎裂(同步母离子选择,SPS),使MS3光谱中报告离子的强度提高了10倍以上,显著改善了动态范围,降低了报告离子信号方差。然而,仅采用基于强度的选择,这意味着选择来自多个前体的碎片离子是不可避免的。MultiNotch MS3方法是在Orbitrap Fusion质谱仪上实现的,它有一个离子阱和一个用于多级破碎的专用碰撞池。由于需要额外的扫描事件,因此与基于MS2的定量方法相比,基于MS3的方法具有更长的DDA循环时间,因此蛋白质鉴定更少。最近有报道称,实时数据库搜索平台Orbiter可以在给定的MS2谱中没有匹配的肽段时,通过取消SPS MS3扫描来缩短循环时间。与以前的多点MS3方法相比,基于实时数据库搜索的SPS MS3获取速度提高了一倍,从而获得了更多的定量蛋白质。
高场非对称波形离子迁移率谱(FAIMS)是一种根据气相离子在强电场和弱电场中的行为来分离气相离子的大气压离子迁移率技术。FAIMS易与电喷雾电离对接,已被广泛用作在线分离的一种手段。PamiMatter等人利用FAIMS通过增加基于离子迁移率的分离维度来减少比率失真,以减少前体离子共碎裂的机会。事实上,FAIMS被证明在不牺牲肽/蛋白质鉴定的情况下,有力地提高了TMT定量的准确性和精确度。
所有上述方法都旨在通过避免数据采集过程中的肽共碎裂来减轻报告离子的比率失真。另一种策略是采集后数据处理,例如根据前体离子在LC中的洗脱曲线确定前体是否共碎裂。前体离子的卷积程度可以用来降低嵌合MS2谱对定量结果的加权贡献,或者丢弃给定的MS谱。虽然它减少了可量化多肽的数量,但这种类型的策略仍然是最简单的,因为它不需要任何专门的设备和额外的离子分离或碎裂程序。
3.2基于肽骨架碎片离子的定量
基于报告离子的方法(如 TMT 或 iTRAQ)中比率失真的根本原因是报告离子对靶向肽段没有特异性。这使得一旦不同的肽被共碎片化,报告离子就无法准确反映定量信息。为了规避这个陷阱,人们提出使用肽骨架的特定碎片离子进行定量。在基于肽骨架碎片离子的方法中,即使相同标签标记的不同肽可能被共碎片化,肽特异性碎片离子仍然可以溯源至正确的肽,因此定量信息也可以被正确分配。
3.2.1 基于IPTL的标记策略
Koehler等人首先报道了等重肽末端标记 (IPTL) 并提出了基于序列特异性碎片离子定量肽的概念。最初的 IPTL 方法使用 2-甲氧基-4,5-二氢-1H-咪唑 (MDHI) 和四氘化形式 2-甲氧基-4,5-二氢-1H-咪唑-4,4,5,5-d4 (MDHI-d4) 以特异性修饰 Lys 的ε-胺基团,然后用琥珀酸酐 (SA) 或四氘代琥珀酸酐-d4 (SA-d4) 衍生化 N 端胺基团(图 15)。因此,来自两个样品的肽被不同的同重标签标记,但在碎裂时会产生一组不同的碎片离子。由于 N 和 C 末端包含不同的标记,因此可以通过比较单个 y 和 b 系列碎片离子的强度来推断肽和蛋白质的比例。即使在同一前体分离窗口中选择了一种以上的肽,所得的 b 和 y 离子通常也可以正确地溯源至相应的肽。由于每个光谱的多个量化数据点,对于每个 y 和 b 离子IPTL 可能比基于报告离子的方法定量更准确。IPTL并不是指具有特定结构的标记,而是指一种通过修饰肽末端来实现同量异位的标记策略。下列多种同位素标记方法都基于这一原理,如基于选择性琥珀酰化和二甲基化的三重-QITL、IVTAL、基于 SILAC 和蛋白水解 18O 标记的 G-IVTL、QITL、diDO-IPTL 或基于所谓的伪同量异位二甲基标记的pIDL、PITL 和SWATH-pseudo-IPTL。尽管已经报道了许多方法,但基于 IPTL 的方法不如基于报告离子的方法广泛使用,大概有两个原因:(1)它们的多路复用容量有限,尤其是在避免氘标记时;(2)由于碎片离子的多重态,MS2 谱图的复杂性随着多路复用水平的增加而增加。
图15 原始 IPTL方法的示意图概述
IPTL,同量异位的肽末端标记
3.2.2 具有更高复用容量的新型IPTL设计
大多数上述基于 IPTL 的方法可以实现高达三重的多路复用,这远低于基于报告离子的方法(例如,TMT 最近已在单次 LC-MS 运行中扩展到 16重标记)。最近,Liu等人报道了所谓的伪等重二甲基标记 (m-pIDL) 方法,该方法将多路复用容量增加到6重。m-pIDL依赖于10Th 的宽隔离窗口,这进一步增加了 MS2 光谱的复杂性。此外,在标签中使用氘会带来改变标记肽保留时间的风险,并可能导致定量不准确。为了提高非氘标记的IPTL多路复用容量,我们最近提出了选择性马来酰化定向同量异位肽末端标记 (SMD-IPTL) 方法,它不仅保留了所有IPTL 方法的优点,也将复用容量提高到至少4重标记,并有可能扩展到7重标记13 C或15 N-标记的半胱氨酸、丙氨酸和乙酸酐(图16A)。SMD-IPTL 基于LysC肽N末端的选择性马来酰化。新引入的马来酰衍生物可以用不同同位素形式的乙酰半胱氨酸进一步修饰,而在C 端插入互补同位素标记的乙酰丙氨酸以平衡修饰肽的总质量,如图16B 所示。此外,在数据采集过程中使用0.8 Th偏移量的前体离子隔离窗口可以简化碎片离子的同位素包络,从而有助于推导出碎片离子比率(图16C)。
图16 SMD-IPTL方案
(A) 同位素标记的乙酰半胱氨酸和乙酰丙氨酸的七种可能组合。标有星号的原子表示13 C或15 N;(B) SMD-IPTL的样品制备和标记步骤的工作流程;(C) 7 重标记样品混合物的LC-MS过程
3.2.3 具有更简单 MS2的新型 IPTL 设计
尽管在比率失真和定量准确性方面,IPTL 方法与基于报告离子的方法相比具有优势,但在肽鉴定方面仍有改进的余地,这是准确定量的前提。在IPTL实验的MS2中碎片离子的数量乘以标记样品的数量,这为定量提供了更多的数据点,但使鉴定更具挑战性。为了保存并从IPTL数据中检索准确的定量信息,人们已经报道了各种软件解决方案,例如 IsobariQ、ITMSQ和PISA。如果 MS2 碎片离子光谱的多样性不随多路复用水平成比例,则将有助于从IPTL数据中鉴定肽。为此,我们开发了碰撞诱导解离 (CID)可裂解的同量异位乙酰基-异亮氨酸-脯氨酸-甘氨酸 (Ac-IPG) 标签(参见图 17A)。Ac-IPG 标签基于选择性 N 端二甲基化,然后用同量异位的Ac衍生化肽的C端Lys残基处的ε-胺基团-IPG 标签,从而在Pro-Gly和Ac-Ile上具有互补的同位素分布。如图17B所示,Ile 和 Pro 之间发生碎片化以及 CID 时肽骨架断裂。虽然生成的 y 离子可以根据 Pro-Gly上的不同同位素在标记通道之间进行区分,从而包含相应肽的定量信息,但不同标记通道的b离子具有相同的m/z值,这可以使用常用算法进行数据库搜索(参见图 17C)。Ac-IPG标签保留了基于特定肽片段离子定量肽的优点,同时与传统的IPTL方法相比降低了MS2光谱的复杂性,从而促进了肽的鉴定。Ac-IPG标签用于三重标记,但通过报道的合成路线,多路复用容量通过使用13 C 和15 N 标记的乙酸酐、异亮氨酸、脯氨酸和甘氨酸可以扩展到10 重。
图17 Ac-IPG 方法的示意图
(A) Ac-IPG-PNP 标签的功能设计(三重 Ac-IPG-PNP 标签的13 C同位素位置用星号标记);(B) 三重等重标记步骤;(C) 三重标记样品混合物的 LC-MS
3.3 基于肽偶联报告离子的定量
在基于报告离子的方法中,例如TMT,来自同一样品的不同肽被标记有相同的标签,这会导致在串联MS时释放无法区分的报告离子并伴随着共碎裂时比率失真的相关风险。值得注意的是,其余部分称为“肽偶联报告离子”,包含连接有平衡基团的前体完整肽序列,因此包含报告离子的互补定量信息(见图 1)。与报告离子相反,由不同肽产生的肽偶联报告离子具有特异性的,它们在标记通道之间的质量差异可以在高分辨率MS2光谱中区分(例如Orbitrap)。只有在肽偶联报告离子之间的差异太小而无法在设定的MS2分辨率下区分的极端情况下,才能从肽偶联报告离子中准确推断出定量信息。与基于 IPTL 的方法相比,基于肽偶联报告离子的定量的最大优点是差异标记的肽具有相同的前体质量和相同的碎片离子。虽然迄今为止基于报告离子的方法属于鸟枪法蛋白质组学的主流,但最近只有少数关于基于肽偶联报告离子的方法的报告,即TMTc、TMTc+、EASI和Ac-AG标签。肽偶联报告离子的局限性在于它们通常位于m/z 500-1500之间的范围内,这使得无法使用中子编码来扩展多路复用容量,因为需要超过100万的分辨率才能分辨差异标记的离子。
3.3.1 TMTc、TMTc+和EASI标签
Wühr等人首先提出了基于肽偶联报告离子的定量方法,并称为TMTc。然而,他们发现了引起定量不准确的两个缺点:(1) 形成肽偶联报告离子的效率适中;(2) 肽偶联报告离子的复杂同位素需要解卷积来提取定量信息。在第一份报告中,最初设计用于有效形成报告离子的 TMT 标签被用于标记,并使用 2 Th 的隔离窗口来隔离前体离子以进行碎裂。TMTc+使用0.4Th 前体分离窗口来促进数据处理,因为单同位素前体离子峰是专门分离的,避免了来自不同标记通道的重叠同位素包络的去卷积。由于 TMT 标签的原始设计有利于二甲基哌啶环上的电荷隔离,因此肽偶联报告离子形成的概率不大。这表明基于肽偶联报告离子的方法需要专门设计的标签。
最近推出的 6 重 EASI 标签利用基于亚砜的碎裂位点来提高肽偶联报告离子形成的效率,并应用不对称隔离窗口(0.4 Th和 -0.15 Th 偏移)来简化肽的同位素偶联报告离子。如图 18 所示,EASI 标签由中性丢失基团、平衡基团和胺反应性NHS酯组成。EASI 标签的设计使基于先前的工作,表明与亚砜基团相邻的C-S键在低归一化碰撞能量 (NCE) 下很容易断裂,而不会断裂肽骨架,随后在更高的碰撞能量下产生肽主链的碎片离子。在增强的肽偶联报告离子推动下,EASI 标签在灵敏度方面取得了显着改善,从而实现了更好的定量准确度和精确度。
图18 6-plex EASI tag的功能设计和同位素分布
13 C同位素位置标有星号
3.3.2 Ac-AG 标签
我们小组最近报道的三重Ac-AG标签是EASI标签的替代方案,它由三部分紧凑结构组成(图19C):(1)Ac-Ala,Ala和甘氨酸残基;(2)Gly部分,它将保留在肽偶联的报告离子上;(3)胺反应性对硝基苯酚酯(PNP)。Ac-Ala和Gly部分之间设计了互补同位素分布,因此不同形式的Ac-AG标签是等重的。为了提高电离效率并促进b离子的形成以及阻断N端胺基团,在将Ac-AG标签偶联到C端的ε-胺基团之前,我们首先将N端胺基团进行二甲基化LysC肽的Lys残基。标签的关键特征是在肽主链在低NCE下断裂之前Ac-Ala和Gly片段之间的键产生强烈的肽偶联报告离子,而肽主链的碎片离子在较高NCE下产生。通过在同一个MS/MS扫描中组合两个NCE,我们可以在同一个MS2质谱图中采集鉴定和定量所需的离子。由于N端没有同位素标记并且y离子包含整个Ac-AG标签,来自不同标记通道的肽主链的所有碎片离子具有相同的各自质量,这意味着MS2光谱的复杂性确实不随着差异标记样本的数量而增加。由于Ac-Ala没有良好的电离位点(图19A),它会作为中性分子丢失,并且与来自Ac-AG标签的Gly部分相连的肽偶联报告离子具有与前体相同的电荷状态离子。我们使用0.6Th的窄前体分离窗口来简化肽偶联报告离子的同位素包络,如图19B所示。
图19 Ac-AG方法的示意图
(A) 等重标记步骤;(B) DDA 模式下三重标记样品混合物的LC-MS;(C)三重标记的Ac-AG-PNP标签的功能设计(13 C同位素位置用星号标记)
3.4 基于 MS2 的定量总结
综上所述,基于同位素标记最广泛使用的定量策略是基于报告离子同位素标记法的MS2定量。从2003年提出的第一种TMT方法到最近报道的TMTpro,用中子编码从双重到16重的等重标记能力增加了8倍。在此期间,人们已经提出了一些补救措施,如基于MS3的定量、基于离子迁移率的定量和肽偶联报告离子的定量,以绕过基于报告离子方法的比率失真问题。基于等重标记的定量方法以其优异的通量、精密度和准确度成为定量蛋白质组学中不可缺少的策略。读者可参考最近关于定量蛋白质组学中使用化学标记的更多面向应用的综述。
4. 基于MS1和MS2的组合定量
由于需要更高的多路复用能力,人们已经开发出在同一样品制备流程中结合同位素标记和等重标记的混合标记策略,以将等重标记方法的通量提高两到三倍。基本思想是利用MS1水平上的质量差,在一次LC-MS运行中进一步并行分析两组或三组等重标记样品。已发表的方法包括18-plex Hyperplexing(三重SILAC结合6-plexTMT)、12-plex cPILOT(双N端选择性二甲基化结合6-plex TMT)和24-plex Dileu cPILOT(双N端选择性二甲基化结合12重Dileu),在代谢或化学上结合不同的同位素标记,然后用等重标记进行化学衍生化。由于这些策略都是基于MS1和MS2定量策略的正交组合,它们固有地受到基于MS1和MS2定量问题的困扰,例如MS1水平的光谱的倍增复杂性以及MS2水平的肽共碎裂导致的比率失真。需要指出的是,对于给定的LC-MS平台,更复杂的样品更容易受到这些限制的影响。
5. DIA模式下基于同位素标记的定量方法
如第3节所讨论的,增加标签大小和中子编码用于将DDA中等重标记的通量提高到在单个LC-MS运行中分析16个等重标记样品的最大容量。然而,在DDA串联质谱中前体离子的选择随机性意味着某些肽很有可能被遗漏,这取决于它们在给定样品中的相对丰度。由于在包含数百个或更多样本的研究中,只有在所有运行中测定的肽可以进行可靠的比较,所以使用不依赖于数据并因此不依赖于随机前体离子选择的策略将是有益的。这进一步推动了DIA操作模式的发展,在这种模式下,预定义的m/z窗口中的所有前体离子都被碎裂,尽管它们在MS1光谱中的相对强度可能较低。
DIA方法在大规模生物医学研究(例如与临床生物标志物发现相关的研究)中非常受欢迎,因为它们在很大程度上避免了DDA的缺失问题。当生物学中出现新的见解时,DIA的另一个优点是可以获取样本的数字指纹,可以对新特征(例如生物标志物候选)进行询问,而不需要再次分析样品。
然而,DIA的一个严重缺点是,目前大多数基于DIA的方法每次LC-MS只能分析一个样品,这限制了吞吐量。因此,将DIA与DDA的多路复用容量相结合将是理想的。然而多重标记很少用于DIA,可能是因为目前的方法将导致更复杂的MS2图谱、严重的比率失真、和/或定量准确度和精密度的降低。由于大量的共碎裂,基于报告离子的TMT或iTRAQ方法不适合DIA。对于同位素标记和基于肽碎片离子的等重标记策略,如SILAC和IPTL,来自不同标记渠道的肽具有一组不同的片段离子,这使得MS2谱的复杂性与标记样本的数量成倍增加,使得肽的鉴定极具挑战性,因为DIA的MS2谱已经非常复杂。尽管如此,仍有为DIA开发多路稳定同位素标记策略的初步尝试,下面将对其进行简要讨论。
5.1 NeuCoDIA、MdFDIA 和 mdDiLeu 标签
出于对DIA更高吞吐量的需求,研究人员设计了新的标记策略。最近报道的DIA多路复用方法,NeuCoDIA和mdFDIA在细胞培养(代谢标记)中纳入同位素,而mdDiLeu方法则使用化学标记。它们都有相同的原理,即在多肽中引入中子编码的mDa质量差异。串联质谱时,包含中子编码标签的多个碎片离子代表定量信息,这与第2.4节中讨论的基于中子编码MS1的定量原理相当。这些方法依靠超高分辨率(在m/z100-1000范围内>120k)来区分碎片离子水平上的MDA差异,因此降低了Orbitrap质谱仪的数据采集率。基于Scheltema等人报告的DIA循环时间计算器,2014年,在Orbitrap Fusion质谱仪上使用20个隔离窗口,在MS2分辨率为30k时,循环时间为2.2-4.3 s,而在分辨率为120k时,循环时间增加到约8 s,这是区分中子编码碎片离子的下限。低扫描速率对鉴定和定量有负面影响,总体上不适合大规模的比较蛋白质组学研究。
5.2 Ac-AG标签在DIA模式下的应用
为了在不延长循环时间和使MS2光谱复杂化的情况下提高基于DIA的方法的吞吐量,我们最近提议在DIA模式下使用同量异位的Ac-AG标签,这已在第3.3.2节中讨论过。Ac-AG标签可用于DDA和DIA,因为差异标记样品中的肽具有相同的前体质量,提供相同的肽骨架碎片离子,但具有不同的肽特异性肽偶联报告离子(MS2分辨率为20k的前提下),通常用于各种高分辨率质谱仪的蛋白质组学分析,包括飞行时间质量分析仪。在DDA中,肽偶联报告离子的强度仅反映构成混合物的样品中肽之间的定量比率,而在DIA中,Ac-AG标签产生肽偶联报告离子,具有完整的同位素重叠,并且在解卷积后可以从中推断出定量信息(图20)。预计在不久的将来会出现更多的多重DIA标记策略,并且将在扩展现有算法的基础上开发所需的数据处理方法。
图20 Ac-AG tag在DIA模式下的应用示意图
6. 总结
在本文中,我们讨论了基于稳定同位素的蛋白质组定量方法的发展,并比较了它们的优缺点。从第一个同位素标签ICAT到目前发布的最先进的等重标签TMTpro,用了20年时间。新的同位素和等重标记和标记策略仍有优化和发展的空间,特别是DIA。同位素标记的设计需要同位素标签的设计尤其需要(1)平衡用于定量的离子和用于鉴定的肽骨架碎片离子的形成;(2)避免形成无序列信息的碎片离子;(3)增加多路复用容量;(4)限制合成成本和实用性。在所有讨论的方法中,基于报告离子的MS2或混合定量方法,如TMTpro(16-plex)和DILEU(21-plex),具有最高的复用容量。基于MS3的定量和离子迁移率光谱的辅助相结合,解决了比值失真的问题,但还没有完全克服。例如,在临床蛋白质组学研究中,以合理的成本增加多路复用容量是非常可取的,以允许对大量样本进行分析。我们预计多重标记和DIA的结合将在未来的大规模研究中得到更广泛的应用。此外,应该注意的是,特定标签的广泛使用不仅取决于其技术优势,还取决于其商业可用性。最后重要的是要记住,除了这里讨论的标签策略之外,质谱仪技术的进步和复杂的数据处理工作流程对于推动这一领域的发展也同样重要。
https://doi.org/10.1002/mas.21709
----------微科盟更多推荐----------
长按左侧二维码 进入生科云 | |
生科云所有分析工具可以免费使用,不收取任何直接或间接费用;您还可以在微信上联系微生态老师,随时获取免费的指导,帮助您解决分析时遇到的问题;专业的生信分析团队,持续添加、更新、优化生信云上的分析工具,集成多种生信分析流程,一键批量生成主流科研图,帮您节省时间,有更多的时间探究生物学意义。 |
如果需要原文pdf,请扫描文末二维码领取
蛋白质组期待与您交流更多蛋白质组学问题
(联系蛋白组学老师即可申请入群)
请关注下方公众号
了解更多蛋白质组知识
蛋白质组仅用于学术成果分享与交流,不涉及商业利益。
也严禁他人将本公众号的内容用于商业运营。