科研 |Mol. Syst. Biol.:超高灵敏度质谱定量单细胞蛋白质组的扰动变化
编译:微科盟-廿九,编辑:微科盟Emma、江舜尧。
微科盟原创微文,欢迎转发转载。
导读单细胞技术正在给生物学带来革命性的变化,但目前单细胞技术主要局限于成像和深度测序。然而,蛋白质是细胞功能的主要驱动力,因此,基于质谱(MS)的蛋白质组学对单个细胞的深入表征将具有很高的价值和互补性。在这里,我们开发了一种强大的工作流,结合了小型化的样品制备、超低流速的层析色谱分离和一种新型的捕获离子迁移率质谱仪,使灵敏度提高了10倍以上。我们精确而有力地定量了基于单个流式细胞荧光分选技术(FACS)分离出的细胞蛋白质组及其变化。药物治疗可以在细胞周期的特定阶段阻止细胞,可以找回预期的关键调节因子。我们将430多个单细胞蛋白质组的变异度与转录组数据进行对比,并发现尽管受到干扰,核心蛋白质组仍然稳定,而转录组似乎是随机的。我们的技术可以很容易地应用于组织材料的超高灵敏度分析、翻译后修饰以及小细胞计数的小分子研究,以获得对健康和疾病中细胞异质性的参考信息。
大纲
一种新的超高灵敏度LC-MS工作流将灵敏度提高了两个数量级,并实现了真正的单细胞蛋白质组分析。通过比较,我们发现单细胞转录组是随机的,而单细胞蛋白质组是完整和稳定的。1.我们提出了一种高度优化的数据独立性采集驱动的单细胞蛋白质组学工作流程,包括亚微升样品制备、超低流量层析色谱和捕集离子淌度质谱(diaPASEF)。2.单细胞蛋白质组分析是指在整个细胞周期中逐个将细胞注入LC-MS并正确地鉴定细胞状态的过程。3.单细胞蛋白质组信息是对单细胞转录组信息的高度补充4.在单细胞水平上,蛋白质组在数量和质量上是稳定的,而转录组是随机的。论文ID
原名:Ultra-high sensitivity mass spectrometry quantifies single-cell proteome changes upon perturbation译名:超高灵敏度质谱定量单细胞蛋白质组的扰动变化期刊:Molecular Systems BiologyIF:11.429
发表时间:2022.02通讯作者:Matthias Mann通讯作者单位:德国马普生物化学研究所 & 丹麦哥本哈根大学健康与医学科学学院,NNF 蛋白质研究中心
实验设计
实验结果
我们最近引入了平行累积连续碎裂采集模式(PASEF),这是一种质谱学采集方法,其中富集后的多肽离子从捕集离子淌度(TIMS)设备释放到真空系统中。由于异质性和10倍的峰容量,化学噪声分布在质谱中(图 1A和B)。这些前体离子通过数据依赖性(ddaPASEF)模式或以数据非依赖性(diaPASEF)模式以高度敏感的方式碎裂,从而导致非常高的离子利用率和数据完整性。为了探索我们初始LC-MS设置的灵敏度极限,我们在四极杆飞行时间质谱仪(TIMS-qTOF)上测量了从25 ng到几个HeLa单细胞的系列稀释裂解液。我们用DDA获取模式和MaxQuant分析从0.8ng HeLa裂解液中鉴定了550多种蛋白质(图 1C)。我们用稀释因子预期的线性响应对蛋白质进行定量(图 1D)。我们发现最低水平的定量重复性仍然很好(R = 0.96,图 1E)。鉴于单个HeLa细胞的蛋白质含量低至150pg,并考虑到包括蛋白质水解在内的样品准备过程中不可避免的损失,我们估计需要将灵敏度提高至少一个数量级才能实现真正的单细胞蛋白质组学分析。
2. 真正的单细胞蛋白质组分析
影响MS灵敏度的三个主要因素是:电离效率、进入真空系统的转移效率和仪器对离子的利用度。我们首先构建了一台具有离子源的仪器,引入了不同的离子光学元件,并对探测器电压等参数进行了优化。这会导致了四倍以上的离子电流(图 2A)。接下来,我们将0、1和最多6个HeLa单细胞分成四份,放入384个孔中,分别进行处理,并在改进后的质谱仪上进行分析。这使得0、1和最多6个HeLa单细胞的蛋白平均鉴定量分别为843、1279和1890个。这一分析结果受益于MS1水平上的多肽转换鉴定(图 2B)。当与单个细胞进行比较时,6个细胞的定量精密度和准确度并没有太大的降低(图 2C和D)。丰度排序图显示,所测量的单细胞蛋白质组优先映射到6个细胞蛋白质组中丰度较高的部分,表明蛋白质组的覆盖程度取决于整体LC-MS的灵敏度(图 2E)。单细胞和6个细胞实验之间的共有多肽分析表明,在高信噪比水平下,甚至在单细胞水平下,根据细胞计数强度比趋势,质谱图仍存在可清楚解释的前体同位素模式(图2F)。
3.灵敏度提升10倍
由于电喷雾(ES)与浓度有关,因此灵敏度随流量的降低而增加;然而,极低流量的系统难以稳定运行,因此不能广泛使用。我们最近描述了一种从LC-MS运行中分离样品加载和梯度形成的层析系统,并以1µl/min的标准流速运行,以获得高重现性。这种流量完全由一个泵控制,而不是由其他系统产生的二元梯度。我们发现,它在流速降至25 nl/min时工作稳定,但标准化流量通常为100 nl/min,这使得整个项目能够在相同的柱-滴头设置下稳定运行。我们对ES喷头直径和梯度长度进行了优化,以实现最大限度地减少残留和稳定性。基于MS的真实单细胞蛋白质组学(T-SCP)需要通过蛋白质分离和增溶作用以低损失的方式制备样品,然后进行胰酶蛋白水解和多肽纯化,为MS分析做好准备。我们发现,锥形384孔板中少量的弱有机溶剂为高效的细胞裂解和最小体积的蛋白质水解提供了一个通用和自动化的环境(图 3A)。简单地说,该系统将单个细胞分选到含有1 µl裂解缓冲液的孔中,然后进行加热步骤,并进一步添加含有水解酶的缓冲液到2 µl,所有这些步骤都在封闭的空间中完成的。我们将多肽浓缩在EvoTip设备中,这类似于StageTip的功能,在20 nl纳米袋中,我们将以最小的体积洗脱它们(图 3B)。为了对降低的流速和浓缩的多肽纳米袋洗脱的效果进行基准测试,我们直接比较了1 µl/min和100 nl/min流速的信号轨迹。对于1 ng的多肽,100 nl/min流速会使信号增加10倍(图 3C)。为了在数百个单细胞测量之间实现高数据完整性,我们接下来用diaPASEF取代ddaPASEF。我们发现,结合随后的diaPASEF扫描,100 nl/min的流速设置进一步提高了蛋白质鉴定数量。低流速的液相色谱结合diaPASEF采集模式可以从1 ng多肽样品(图 3D)中高度重复性地鉴定和定量3900多个HeLa蛋白质,与我们最初的设置中鉴定出的550个蛋白质相比,其蛋白数量急剧增加。iaPASEF采集模式的数据完整性为92%,变异系数(CV)< 10%。这表明diaPASEF在极低的样本量下也能发挥它的优势,促使我们在本研究的其余部分中对单细胞工作流采用这种采集模式。
4. T-SCP剖析停滞的细胞周期状态
细胞周期是一个重要的、且被研究得较为透彻的生物过程,经常被用作单细胞研究的测试案例。为了研究我们的蛋白质组学工作流是否能够在单细胞水平上检测药物扰动的生物反应,我们用胸腺嘧啶核苷和诺康唑处理HeLa细胞,以产生四个在特定细胞周期阶段富集的细胞群体(231个细胞;图 4A)。我们使用一个包含大约4000个蛋白质组的HeLa dia谱库,对每个单个细胞多达2083个蛋白质进行了定量,我们总共定量了2501个蛋白质。这一数字从G1的中位数1018到G1/S的1932,G2的1572和G2/M的1705不等(图 4B)。为了估计每个细胞的总蛋白质含量,我们根据所鉴定的多肽对所有蛋白质信号进行求和。我们根据蛋白质含量判断,G2细胞大约是G1细胞的1.8%;因此,T-SCP正确地反映了细胞的增殖状态,同时突出了在批量样本分析中隐藏的每个细胞周期阶段的异质性(图 4C)。为了能够直接比较单细胞蛋白质组,并消除由于每个细胞的总蛋白量和鉴定不同而导致的蛋白质丰度差异,我们使用搜索引擎DIA-NN提供的跨细胞保留时间依赖的归一化模块对我们的数据进行标准化处理。此外,我们严格过滤了数据集,每个细胞至少有600个鉴定蛋白质,其余单个细胞中每个蛋白质的观察值超过15%。不同细胞周期状态的蛋白质组在主成分分析(PCA)图中聚集在一起(图 4D)。除了这些药物干扰的细胞外,我们还测量了来自两个独立细胞培养批次的200多个未经处理的细胞。这些细胞的蛋白质组在细胞周期状态中分布良好,而不同传代批次的蛋白质组在G1和G2期有所富集。这突出表明,生物变异主导了剩余的技术变异。T-SCP数据集涵盖了分配给许多细胞室、膜和生物过程的蛋白质,这些蛋白质涉及生物调节、新陈代谢、运输和信号转导,尽管严重的系统扰动导致了明显的生物变异和蛋白质组重构。
接下来,我们研究了单细胞蛋白质组是否可以用于注释细胞状态,类似于单细胞RNA测序(scRNA-seq)的方式。在先前的蛋白质组学研究中,人们发现细胞群因细胞周期状态而富集。在这里,我们选择细胞周期阶段标记蛋白作为G2/M期、G1期或S期蛋白质组中差异表达最大的60个蛋白质组,因为它对批量人群使用了类似的药物治疗,并研究了如何区分不同细胞周期阶段的细胞。我们使用这些标记蛋白来建立细胞周期阶段特定的分数,表明了先前用于scRNA-seq细胞周期阶段预测的可能性。这个模型清楚地区分了G2/M和G1/S时期的细胞。接下来,我们研究了药物抑制的细胞周期阶段G2/M和G1/S之间的差异表达蛋白质。在显著调控的蛋白质中,有大量已知的细胞周期调节因子,我们突出显示其中一些蛋白质 (图 4F)。碎片离子水平的定量MS数据对这些数据具有非常重要的意义,如细胞周期调节因子CDKN2A、STMN1。我们的单细胞数据集也发现了以前与细胞周期和G2/M转变无关的蛋白质。例如,我们明确鉴定出了NA CA蛋白。
5.SC蛋白质组与转录组的比较
给定我们的一组430多个单细胞蛋白质组,我们将过滤后的T-SCP测量结果与类似的单细胞RNA测序数据(scRNA-seq)进行了比较。我们从同一细胞系统上选择了两种广泛使用的scRNA-seq (Drop-seq)和通量较低的SMART-seq2技术。Drop-Seq方法基于唯一分子识别符(UMIs)来控制数据库制备中的扩增偏差,而SMART-Seq2方法不受UMI控制。基于MS的蛋白质组学本质上不涉及任何扩增,也不受相关伪影的影响。尽管有细微的差异,HeLa细胞的培养应该反映了基因和蛋白质表达状态的分布特征。这一假设将使我们能够评估测量技术的自我一致性。首先,我们计算了细胞的所有配对相关系数的分布。我们发现在蛋白质组测量中,细胞的平均相关性高于基于液滴的方法和SMART-Seq2方法,在分析每个特定数据集中的所有可用基因以及分析所有共有基因时也是如此(图 EV4A)。我们比较了基因或蛋白质表达完整性的所有三个数据集后发现,每个细胞的蛋白质表达完整性服从正态分布(图 5A)。此外,当在共有基因水平上比较基因或蛋白质表达的完整性时,SMART-Seq2数据集中的饱和测序效应变得较为明显。两个单细胞RNA测序技术数据集都遵循双模态基因完整性频率分布,而单细胞蛋白质组则不符合。
接下来,我们研究了在蛋白质测量中是否存在检测的系统性限制。我们在蛋白质测量的较低丰度范围内确定了这种检测极限。这表明,除了提高灵敏度之外,我们的单细胞蛋白质分析还可以受益于归因法或基于似然的参数估计方法。对于批量测量,转录水平通常与相应的蛋白质水平适度相关,然而,这种相关性在很大程度上取决于生物状况。在单细胞水平上,这种效应被不同的测量技术以及转录组和蛋白质组之间的基本生物学差异进一步影响。在我们的数据中,scRNA-seq测量可以在多大程度上作为蛋白质测量的替代技术,但在主成分分析中我们发现蛋白质与RNA明显分离(图 5B)。虽然单细胞转录表达水平在单细胞RNA-seq技术之间具有很好的相关性,但它们与单细胞蛋白质测量有所不同(图 5C)。
6.T-SCP揭示稳定的核心蛋白质组
由于蛋白质组和转录组水平之间的相关值不同,我们接下来研究了基因表达作为丰度函数的变异性。对于蛋白质表达的测量,所覆盖丰度之间的变异系数非常小(图 5E)。这与一个模型是一致的,在该模型中,被覆盖的蛋白质组是稳定的,并且在其整个动态范围内可以被稳定的检测。相比之下,对UMI控制和非UMI控制的scRNAseq数据的相同分析显示,单细胞RNA-seq的变异系数与蛋白质测量相比,总体转录组变异性要高得多(图 5D)。值得注意的是,未来基于MS蛋白质组学灵敏度肯定会越来越高。将单细胞蛋白质组与6个细胞蛋白质组进行比较(图 2C)表明,MS灵敏度的适度增加可以定量很大一部分稳定表达的蛋白质组。我们还观察到,单细胞转录组由脉冲噪声主导,具有泊松分布,因为许多转录组的表达平均低于每个细胞的一个拷贝。这意味着一个给定的单个细胞可以有零个、一个或两个其表达基因的转录组,当将许多单细胞测量值相加时,就会导致泊松分布。对于具有较高表达值的基因,每个细胞中总是存在转录产物,然后这些基因的表达分布不是脉冲噪声主导的。相比之下,对于蛋白质,CV仅取决于测量灵敏度,因为每个细胞中总是有足够的副本,以确保它们的表达水平不受生物脉冲噪声的限制(图2A)。基于这些观察,我们在蛋白质组学数据中定义了一个“核心-蛋白质组”子集,方法是选择前200个蛋白质,其中包括受药物干扰的蛋白质,这些蛋白质的CV值最低,在430多个单细胞中至少有70%的蛋白质使共有的。有趣的是,这些蛋白质很好地分布在蛋白质组的动态范围内(图 5D)。值得注意的是,我们在单细胞转录组数据(图 5E)中发现了核心蛋白质组的相应转录产物分布在整个CV范围内。核心蛋白质组突出显示了经常用于标准化的蛋白质,如热休克蛋白90提供了阳性对照(图 5F)。核心蛋白质组的CV排序图还揭示了一组不同的蛋白质集。有趣的是,我们还发现TPD52L2是最稳定的蛋白质之一,而TPD52L2又被描述为HeLa细胞和SUMO2中含量最丰富的蛋白质之一,SUMO2以参与过多的重要调控细胞过程而闻名,这表明即使在蛋白质组重构期间,细胞中也有稳定的SUMO2集合。
讨论
T-SCP管线结合了与超低流量液相色谱耦合的小型化样品制备和新型质谱仪,为单细胞分析带来了至少一个数量级的灵敏度增益和最高的稳定性。我们量化了靶向扰动后的细胞异质性,这使得人们在蛋白质组水平上直接分析单细胞层次上的药物反应成为可能。此外,单细胞RNA和蛋白质组水平的比较表明,蛋白质组是稳定的,而转录组更具随机性,这为在单细胞水平上阐明翻译机制奠定了基础。
虽然这里主要展示了单细胞总蛋白质组的测定数据,但在我们的工作流程中实现的灵敏度在任何样本量受限的情况下都是有用的。这包括对其他化合物类别的研究,如代谢物或药物,来自少量细胞或体内材料的翻译后修饰,以及直接从石蜡包埋的福尔马林固定(FFPE)病理标本进行测量。
我们的离子淌度增强型工作流也与化学多路复用兼容,优点是可以省略或减少导致报告离子扭曲的booster通道,并有利于替代多路复用策略,如互补TMT或EASI-TAG。此外,还有许多机会来提高整体灵敏度,包括更好的离子源、改进的色谱层析分析和建模工具,类似于scRNAseq领域最近的进展。
https://doi.org/10.15252/msb.202110798
----------微科盟更多推荐----------
科研 |台湾大学:集成微流控芯片和数据非依赖性采集质谱的流线型单细胞蛋白质组学
科研 |单细胞和血浆蛋白质组学综合模型预测手术部位并发症:一项前瞻性队列研究(Ann Surg)
如果需要原文pdf,请扫描文末二维码领取
蛋白质组长期接受科研文章/经验投稿,期待与您交流更多蛋白质组学问题
(联系多组学老师即可投稿&申请入群)
请关注下方公众号
了解更多蛋白质组知识
蛋白质组仅用于学术成果分享与交流,不涉及商业利益。
也严禁他人将本公众号的内容用于商业运营。