虐遍全球11家质谱实验室,只为DIA打call!
近期,科技君陆续为大家介绍了华大蛋白定量DIA技术的新进展。蛋白定量DIA技术昭示着第二代蛋白质组学研究时代的到来,同时也有些“保守派”不禁提出:新技术不成熟,还是传统的蛋白定量技术靠谱。今天,科技君为大家展示一篇刚于昨日在Nature子刊上线的文章[1]。该文章评估了全球11家实验室(包括华大基因)的SWATH(DIA)技术的重现性、定性、定量的性能。技术成熟与否,看完这篇多方位的评测解读您就知道了。(SWATH,sequential isolation window acquisition,主要采用DIA技术的核心理念开展的质谱数据采集定量方式[2])
该项研究是由质谱与蛋白质组学领域大咖、苏黎世联邦理工学院(ETH Zurich)Ruedi Aebersold教授牵头,联合全球不同地点的11家质谱实验室,采用相同的实验和分析流程,对SWATH(DIA)技术进行综合评估。文章得出重要结论:不同实验室采用SWATH-MS技术可得到重现性很好的蛋白组定量数据,本研究为SWATH-MS技术在大规模蛋白定量领域开展应用确定基础。
摘要:基于数据依赖型采集模式(Data-Dependent Acquisition,DDA)的质谱技术为蛋白定量研究提供了非常大的帮助,但在大样本量的整体分析上仍面临定量数据重现性差的挑战。SWATH-MS作为近日新兴发展起来的蛋白定量技术,它继承了DDA蛋白定量技术大规模定量的功能,又保持了靶向蛋白定量技术准确、灵敏和特异性的定量优势。本研究利用分布在全球11个地点的实验室的SWATH-MS数据,一致鉴定并定量到HEK239细胞中的超过4000个蛋白质,同时展示了不同实验室产生的定量蛋白数据具备很好的重现性。
背景:实验结果可重复是科学研究的基础。SWATH-MS技术在质谱检测仪器和分析流程两个维度,关于重复性的研究已经被报道过。但是,基于相同实验样本,相同仪器,相同分析流程下,在不同实验室、不同数据采集时间的重复性还没被探究过。
本文评估了所有参与者共同鉴定和定量到的蛋白数据集,其重现性、线性动态范围和灵敏度都非常接近于SRM——蛋白定量金标准。这份数据支持DIA联合肽段标准打分的分析方法,适合于大范围实验室间全面、重现性好的蛋白组研究。
图1 实验设计
30个稳定同位素标记肽段(SIS)分成5组(group A-E),每组6种肽段,每组样本中肽段的稀释浓度从1fmol到10pmol(绿色标记S5),然后将每组肽段稀释4次后混入HEK293样本中(S1-4),获得一系列稀释浓度从0.012到10000fmol。将样本分成相同的11份分发给全球范围内的11个实验室,分别评估1天、1周内不同地点的数据采集情况。
1.蛋白鉴定情况
在全球11个实验室采集的229份SWATH-MS数据中,过滤条件为蛋白水平FDR 1%,共检测到4984种蛋白,4077种蛋白在超过80%的样本中被检测到。
图2 蛋白鉴定的数目和一致性
每种颜色代表一个实验室的所有数据,11个实验室所有数据集的重复性中位数是91.6%(蛋白水平)和79.5%(肽段水平)
2.定量重现性
经过肽段水平的中位数均一化后,利用4077种在超过80%样本中检测到的蛋白去计算同一天内、不同天内、不同实验室数据采集之间的变异系数,分别是8.3 ± 16.2%, 11.9 ± 17.2%, and 22.0 ± 17.4%。
图3 变异系数(点击可查看原图)
比较单个实验室一天内及多天内的CV变化,以及不同实验室间的CV变化
3.线性和动态范围
利用样本中加入的同位素标准肽段,在每个实验室计算梯度浓度设置的标准肽定量结果线性拟合系数,平均决定系数(R2)是0.97。去除高浓度肽段信号饱和的点,决定系数增加到0.99。在样本之间设置的标准肽理论倍数有9和27,实际检测到的差异倍数是7.49和19.6,主要原因也是高浓度的标准肽已经导致质谱仪信号检测饱和。
图4 平均峰面积和蛋白水平动态范围统计
平均峰面积图各点连接显示出各实验室间良好的线性指标(图左),蛋白水平动态范围是4.5个数量级范围(图右)
4.SWATH-MS灵敏度和MS1相比较
SWATH-MS的LLOQ(甚低定量限)在10-18到10-15摩尔每μg样本。在数据分析上,本研究比较了利用MS1定量和SWATH-MS定量的LLOQ。SWATH-MS的信号在低水平浓度情况下,不易受母离子信号干扰,所以,LLOQ比MS1定量方法低1个数量级,SWATH-MS定量灵敏性更优。
图5 SWATH和MS1的LLOQ比较
SWATH技术(红色)比MS1定量技术(蓝色、黄色)相比,有更低的检测限
5.全球范围内蛋白定量丰度的相似性比较
研究衡量不同实验室定量结果的相似性,计算了229个数据之间任意两个的泊松相关系数,最低是0.868,中位数是0.94。另外,单独计算了每个实验室内采集数据的相关性,泊松系数是0.948到0.984,中位数是0.971。说明,数据采集地点的不同对定量结果影响极小。
图6 实验室间两两比较蛋白丰度定量情况
展望:首先,目前SWATH-MS蛋白定量技术没有选择最优肽段定量蛋白,是未来优化技术的一个方向。
其次,这个研究证明了SWATH-MS适用于大规模样本蛋白组学水平的定量,为后续的药物靶点研究、精准医疗提供了必要工具。
最后,大规模样本量的蛋白组学定量,可与基因组学水平的关联分析,比如基于蛋白表达水平的数量遗传性状研究和基于蛋白表达水平的全基因组关联分析和药物筛选。
综上:由Ruedi Aebersold教授牵头的这篇在不同实验室间开展的研究证明,通过SWATH技术(DIA)可获取重现性非常好的定量蛋白质组数据,为实现大规模蛋白组学水平研究建立了坚实的技术基础。华大基因作为这项研究的11个参与者之一,按照统一的操作流程,展现出高水平的DIA技术交付能力,从鉴定数、重现性、线性、动态范围等方面看,已达到全球先进水平!华大蛋白定量DIA产品,具有极佳的软硬件优势和过硬的操作流程。
别犹豫了,华大蛋白定量DIA——您开展蛋白组学定量研究的首选技术!
华大科技
您的首选科研合作伙伴
请联系当地销售代表或拨打4007066615热线
【参考文献】
[1] Multi-laboratory assessment of reproducibility, qualitative and quantitative performance of SWATH-mass spectrometry. Ben C Collins, Christie L Hunter, Ruedi Aebersold, et al. Nature Communications.
[2] Targeted data extraction of the MS/MS spectra generated by data independent Acquisition: a new concept for consistent and accurate proteome analysis. Ludovic C Gillet1, Pedro Navarro1, Ruedi Aebersold, et al. Mol Cell Proteomics.
撰稿:段欣、王杰
编辑:市场部
近期热文
请继续关注“华大科技BGITech”公众号,
科技君将一如既往地为您提供精彩内容!
如有相关问题,欢迎后台留言~~
▼
关注华大科技,尽享精彩科研!