蛋白组学研究在生命科学研究领域具有广泛应用,对生物样品蛋白组学数据进行分析,蛋白能否被精确定量十分重要,尤其是低含量蛋白。带同位素标签的蛋白组学技术(TMT/iTRAQ)是非常重要的蛋白组检测手段,通过对MS2肽段碎裂得到的报告基团离子强度进行计算获取肽段的相对含量值。碎裂的前体离子由MS1筛选得到,在理想状态下,每次只筛选出一种离子进行碎裂分析。而实际上,会筛选出与设定m/z值接近的杂质离子同时破碎,这会对定量结果形成干扰。通过评估共选前体离子报告基团含量确定干扰大小,从而对定量数据进行校正能够提高输出结果的精确性。
有研究人员通过实验分析了蛋白组学研究常见方法(标记方法:TMT、iTRAQ;非标记方法:Label-free)的定量精度影响因素以及样本检测量线性变化的浓度范围,以便于得到相对准确的定量结果以及设置参数降低假阳性概率。研究人员以人细胞裂解液蛋白为背景蛋白,加入57种标品蛋白来分析复杂样品中前体共选对定量精度的影响。同时分析检测结果随样品浓度梯度变化的线性变化范围。研究结果显示,TMT定量鉴定会得到最多的蛋白数量,并且TMT标记更敏感,噪音信号水平更低。当然,如果超过20个样本,更建议使用DIA技术哦。
在实验过程中,TMT/iTRAQ以标签质谱强度为相对定量值,而Label-free则以MS1质谱峰面积为相对定量值。1) the Universal Proteomics Standard mix (UPS2, Sigma-Aldrich,St. Louis, MO)2) a set of 9 standard proteins (MSCAL 1, Sigma-Aldrich and P77305, New England Biolabs)Fig. 1 Samples and experimental designFig. 2 Area proportional Venn diagrams showing the number of protein identifications and identification overlap of labeled (iTRAQ, TMT) and label-free datasets.以上结果表明三中检测方式检测出的蛋白大部分相同,而TMT检测蛋白总量最多,而且鉴定蛋白具有较高的蛋白序列覆盖度。①isolation interference:进行PSM操作时杂质离子占比②reporter ion interference:非目标报告基团离子强度在所有报告基团离子强度中的占比在本研究中,研究人员对蛋白酶解肽段进行了pI预处理进行分离。理论上,预处理后得到的肽段能够代表96%以上的蛋白,但是其复杂度会极大降低,有助于蛋白的鉴定。然而在本研究中,pI预分离对isolation interference的影响并不大,TMT所受影响则相对更小。同时作者比较了isolation interference和reporter ion interference之间的相关性,但是依据本项目的研究数据,两者之间并不相关。Fig. 3 Percent isolation interference versus reporter ion interference for all peptide spectrum matches (PSM´s) of unique peptides.Fig. 4 Correlation between the main measure of PSM score and the two measures of interference: reporter ion interference and isolation interference.另外,作者比较了iTRAQ和TMT质谱数据报告基团离子强度的中值,数据显示TMT报告基团离子强度约为iTRAQ的2倍,这也能解释为什么TMT检测的噪音水平更低,定量结果影响更小。Fig. 5 Intensity distribution of the iTRAQ and TMT reporter ions.
Fig. 6 Limit of quantification (LOQ) estimated from noise level calculations.由于isolation interference和reporter ion interference之间并不具有较强的相关性,所以作者将两者对定量精度的影响分开分析。将原始文件进行两次搜库操作:1)以TMT作为定量标签,iTRAQ为干扰标签;2)以iTRAQ作为定量标签,TMT为干扰标签。Fig. 7 Spiked standard protein amount versus measured reporter ratio of the peptide spectrum matches.
由图可见,isolation interference和reporter ion interference均对定量结果有一定影响,其中,isolation interference的影响相对较小。而且,当isolation interference在30%以下时,能得到较好的定量结果。本研究的输出数据中,PSM 的isolation interference值在30%以下的比例达到了2/3。对比iTRAQ和TMT的数据可以看出:TMT定量比iTRAQ对isolation interference更加敏感。比较A、B、G数据可以看到,isolation interference对低含量蛋白的定量精度影响更大。同时从B组数据可以发现,当isolation interference值较低时,定量结果更加准确。基于图7的分析结果,在进行reporter ion interference对定量分析时,将PSM的isolation interference值设置为30%(以A为例),而低含量蛋白样品(B-G)isolation interference设更加严格(10%)。图8中,A、B结果显示iTRAQ和TMT的检测数据大约从1fmol开始蛋白检测量发生线性变化。TMT的标准曲线大概从2fmol开始呈现线性变化趋势,而iTRAQ起始于1.2fmol。TMT 检测数据并不包含1.2fmol,当浓度低于1fmol时,标准曲线比较杂乱,同样也低于两种检测方式的定量限。粗略来看,蛋白样品在0.87-6fmol(B)浓度下呈现线性变化趋势,而进一步降低浓度,则线性变化趋势则不再明显(C:0.087-0.6)。G组设置浓度范围较广(0.002-40fmol),从G组数据可以看出,整个数据的线性变化起始位点大概为1fmol。综合A、G数据,即使设计浓度达到了85fmol,但依然没有达到定量检测线性变化的上限值,所以这两种蛋白检测方式究竟在多少浓度范围内适合没法确切给出,但可以确定的是,至少在100以内是可行的,这与已有报道也是相符的。而对于Label-free, A组蛋白(8-60fmol)数据呈现线性变化趋势,B组只有部分蛋白(如P04040)能够在0.8fmol以上浓度范围内线性变化。C、E的设定浓度在检测限以下。而在G组中,哺乳动物中不存在的XXXX2(TPI,E.coli)和P0088从0.15fmol点开始呈现线性变化趋势。Fig. 8 Correlation of theoretical molar amounts versus measured reporter ratios of the standard proteins by label-based and label-free quantification.进行质谱检测时,样品信号只有达到背景信号的3倍才认为样品浓度达到了检测限。对不同蛋白组学技术手段的检测限进行分析:假设不同样本的背景蛋白含量相同,对TMT和iTRAQ检测限的评估采用相对含量,Label-free采用归一化的MS1谱峰面积。(PSM isolation interference设置为30%)由图8可见,三者的LOD的下限值均约为1fmol。而对于iTRAQ和TMT,由于只能检测相对含量,噪音评估值不能加回标签峰强中用于后续计算。在本研究中,相对iTRAQ,TMT的噪音水平较低,说明TMT检测方式更加灵敏。1、TMT定量鉴定会得到最多的蛋白数量,并且TMT标记更敏感,噪音信号水平更低。2、检测蛋白浓度范围下限约为1fmol,上限>60fmol。3、定量精度受到isolation interference和repoter ion interference的影响,而受repoter ion interference的影响相对较大。4、进行TMT、iTRAQ蛋白组学研究时,isolation interference值最好设在30%以下。Sandberg A, Branca RM, Lehtiö J, Forshed J. Quantitative accuracy in mass spectrometry based proteomics of complex samples: the impact of labeling and precursor interference. J Proteomics. 2014