科研 |Mol. Syst. Biol.:超高灵敏度质谱定量单细胞蛋白质组的扰动变化

Original 微科盟蛋白质组 2023-06-07

收录于合集

#蛋白质组 789 个

#质谱 41 个

#单细胞 32 个

点击蓝字“蛋白质组”,轻松关注不迷路

生科云网址：https://www.bioincloud.tech/

编译：微科盟-廿九，编辑：微科盟Emma、江舜尧。

微科盟原创微文，欢迎转发转载。

导读

单细胞技术正在给生物学带来革命性的变化，但目前单细胞技术主要局限于成像和深度测序。然而，蛋白质是细胞功能的主要驱动力，因此，基于质谱(MS)的蛋白质组学对单个细胞的深入表征将具有很高的价值和互补性。在这里，我们开发了一种强大的工作流，结合了小型化的样品制备、超低流速的层析色谱分离和一种新型的捕获离子迁移率质谱仪，使灵敏度提高了10倍以上。我们精确而有力地定量了基于单个流式细胞荧光分选技术(FACS)分离出的细胞蛋白质组及其变化。药物治疗可以在细胞周期的特定阶段阻止细胞，可以找回预期的关键调节因子。我们将430多个单细胞蛋白质组的变异度与转录组数据进行对比，并发现尽管受到干扰，核心蛋白质组仍然稳定，而转录组似乎是随机的。我们的技术可以很容易地应用于组织材料的超高灵敏度分析、翻译后修饰以及小细胞计数的小分子研究，以获得对健康和疾病中细胞异质性的参考信息。

大纲

一种新的超高灵敏度LC-MS工作流将灵敏度提高了两个数量级，并实现了真正的单细胞蛋白质组分析。通过比较，我们发现单细胞转录组是随机的，而单细胞蛋白质组是完整和稳定的。1.我们提出了一种高度优化的数据独立性采集驱动的单细胞蛋白质组学工作流程，包括亚微升样品制备、超低流量层析色谱和捕集离子淌度质谱(diaPASEF)。2.单细胞蛋白质组分析是指在整个细胞周期中逐个将细胞注入LC-MS并正确地鉴定细胞状态的过程。3.单细胞蛋白质组信息是对单细胞转录组信息的高度补充4.在单细胞水平上，蛋白质组在数量和质量上是稳定的，而转录组是随机的。

论文ID

原名：Ultra-high sensitivity mass spectrometry quantifies single-cell proteome changes upon perturbation译名：超高灵敏度质谱定量单细胞蛋白质组的扰动变化期刊：Molecular Systems BiologyIF：11.429
发表时间：2022.02通讯作者：Matthias Mann通讯作者单位：德国马普生物化学研究所 & 丹麦哥本哈根大学健康与医学科学学院，NNF 蛋白质研究中心

实验设计

实验结果

1. 降噪定量质谱
我们最近引入了平行累积连续碎裂采集模式(PASEF)，这是一种质谱学采集方法，其中富集后的多肽离子从捕集离子淌度(TIMS)设备释放到真空系统中。由于异质性和10倍的峰容量，化学噪声分布在质谱中(图 1A和B)。这些前体离子通过数据依赖性(ddaPASEF)模式或以数据非依赖性(diaPASEF)模式以高度敏感的方式碎裂，从而导致非常高的离子利用率和数据完整性。为了探索我们初始LC-MS设置的灵敏度极限，我们在四极杆飞行时间质谱仪(TIMS-qTOF)上测量了从25 ng到几个HeLa单细胞的系列稀释裂解液。我们用DDA获取模式和MaxQuant分析从0.8ng HeLa裂解液中鉴定了550多种蛋白质(图 1C)。我们用稀释因子预期的线性响应对蛋白质进行定量(图 1D)。我们发现最低水平的定量重复性仍然很好(R = 0.96，图 1E)。鉴于单个HeLa细胞的蛋白质含量低至150pg，并考虑到包括蛋白质水解在内的样品准备过程中不可避免的损失，我们估计需要将灵敏度提高至少一个数量级才能实现真正的单细胞蛋白质组学分析。

图1 TIMS能够实现了几乎无噪声的光谱和超高灵敏度的蛋白质组学分析A、B，TIMS-qTOF的原理是将单电荷背景峰与多电荷多肽前体离子分开，使前体离子在极低的信号水平下可见(0.8ng HeLa酶解液)；C，从HeLa酶解稀释液中定量的蛋白质，多肽浓度分布范围在0.8ng~25 ng之间，大致相当于我们初始LC-MS设置中3个HeLa细胞中所含的蛋白质数量。D，C中HeLa的线性定量响应曲线。E，连续两次HeLa酶解实验在最低稀释度下的定量重现性(LC-MS/MS的技术重复)。
2. 真正的单细胞蛋白质组分析
影响MS灵敏度的三个主要因素是：电离效率、进入真空系统的转移效率和仪器对离子的利用度。我们首先构建了一台具有离子源的仪器，引入了不同的离子光学元件，并对探测器电压等参数进行了优化。这会导致了四倍以上的离子电流(图 2A)。接下来，我们将0、1和最多6个HeLa单细胞分成四份，放入384个孔中，分别进行处理，并在改进后的质谱仪上进行分析。这使得0、1和最多6个HeLa单细胞的蛋白平均鉴定量分别为843、1279和1890个。这一分析结果受益于MS1水平上的多肽转换鉴定(图 2B)。当与单个细胞进行比较时，6个细胞的定量精密度和准确度并没有太大的降低(图 2C和D)。丰度排序图显示，所测量的单细胞蛋白质组优先映射到6个细胞蛋白质组中丰度较高的部分，表明蛋白质组的覆盖程度取决于整体LC-MS的灵敏度(图 2E)。单细胞和6个细胞实验之间的共有多肽分析表明，在高信噪比水平下，甚至在单细胞水平下，根据细胞计数强度比趋势，质谱图仍存在可清楚解释的前体同位素模式(图2F)。

图2 一种新型的质谱仪可以分析真正的单细胞蛋白质组原始信号A，TIMS-qTOF仪器的原始信号增加(左)和置信度水平(MaxQuant中的定量多肽)(右)；B，1~6个HeLa单细胞的定量蛋白质，橙色和蓝色信号分别表示不同运行间的匹配(MBR)和非匹配情况。灰色(无MBR)或白色(有MBR)的异常值可能是由于FACS分选失败所致 (每个相应细胞计数内的水平线表示中间值)；C，6个细胞重复实验的定量重复性；D，与C一样(这里指两个单细胞实验)；E，6个细胞实验中蛋白质信号的排列顺序(蓝色)，单细胞中的定量蛋白质用橙色着色。F，在单细胞实验(上)和6个细胞实验(下)之间的共有多肽序列的母离子同位素原始MS1能级谱。
3.灵敏度提升10倍
由于电喷雾(ES)与浓度有关，因此灵敏度随流量的降低而增加；然而，极低流量的系统难以稳定运行，因此不能广泛使用。我们最近描述了一种从LC-MS运行中分离样品加载和梯度形成的层析系统，并以1µl/min的标准流速运行，以获得高重现性。这种流量完全由一个泵控制，而不是由其他系统产生的二元梯度。我们发现，它在流速降至25 nl/min时工作稳定，但标准化流量通常为100 nl/min，这使得整个项目能够在相同的柱-滴头设置下稳定运行。我们对ES喷头直径和梯度长度进行了优化，以实现最大限度地减少残留和稳定性。基于MS的真实单细胞蛋白质组学(T-SCP)需要通过蛋白质分离和增溶作用以低损失的方式制备样品，然后进行胰酶蛋白水解和多肽纯化，为MS分析做好准备。我们发现，锥形384孔板中少量的弱有机溶剂为高效的细胞裂解和最小体积的蛋白质水解提供了一个通用和自动化的环境(图 3A)。简单地说，该系统将单个细胞分选到含有1 µl裂解缓冲液的孔中，然后进行加热步骤，并进一步添加含有水解酶的缓冲液到2 µl，所有这些步骤都在封闭的空间中完成的。我们将多肽浓缩在EvoTip设备中，这类似于StageTip的功能，在20 nl纳米袋中，我们将以最小的体积洗脱它们(图 3B)。为了对降低的流速和浓缩的多肽纳米袋洗脱的效果进行基准测试，我们直接比较了1 µl/min和100 nl/min流速的信号轨迹。对于1 ng的多肽，100 nl/min流速会使信号增加10倍(图 3C)。为了在数百个单细胞测量之间实现高数据完整性，我们接下来用diaPASEF取代ddaPASEF。我们发现，结合随后的diaPASEF扫描，100 nl/min的流速设置进一步提高了蛋白质鉴定数量。低流速的液相色谱结合diaPASEF采集模式可以从1 ng多肽样品(图 3D)中高度重复性地鉴定和定量3900多个HeLa蛋白质，与我们最初的设置中鉴定出的550个蛋白质相比，其蛋白数量急剧增加。iaPASEF采集模式的数据完整性为92%，变异系数(CV)< 10%。这表明diaPASEF在极低的样本量下也能发挥它的优势，促使我们在本研究的其余部分中对单细胞工作流采用这种采集模式。

图3 与极低流量色谱和diaPASEF联用的小型化样品制备过程A，流式细胞仪将单个细胞以384孔的格式分选到1 µl裂解缓冲液中，外孔作为定性和定量质控。B，单细胞被裂解以及将蛋白质溶解于72°C的20%乙腈中，37°C水解，肽在StageTips中以96孔的形式浓缩到20 nl纳米袋中。B，这些尖端可以自动拾取的，且多肽纳米袋以低于100nl的体积洗脱。切换阀门后，我们将多肽纳米袋推送到分析柱上并进行分离，由单个高压泵以100nl/min的速度控制。C，标准纳流(100nl/min，橙色)和微流(1µl/min，蓝色)梯度的基峰色谱图，在载物台尖端有1ng的HeLa酶解物。星号表明两次运行中都有聚乙二醇污染物。D，纳流(100 nl/min)和短梯度diaPASEF法相结合。我们使用一到五次重复扫描的总和来寻找在1 ng HeLa水解物下进行高灵敏度测量的最佳方法。
4. T-SCP剖析停滞的细胞周期状态
细胞周期是一个重要的、且被研究得较为透彻的生物过程，经常被用作单细胞研究的测试案例。为了研究我们的蛋白质组学工作流是否能够在单细胞水平上检测药物扰动的生物反应，我们用胸腺嘧啶核苷和诺康唑处理HeLa细胞，以产生四个在特定细胞周期阶段富集的细胞群体(231个细胞；图 4A)。我们使用一个包含大约4000个蛋白质组的HeLa dia谱库，对每个单个细胞多达2083个蛋白质进行了定量，我们总共定量了2501个蛋白质。这一数字从G1的中位数1018到G1/S的1932，G2的1572和G2/M的1705不等(图 4B)。为了估计每个细胞的总蛋白质含量，我们根据所鉴定的多肽对所有蛋白质信号进行求和。我们根据蛋白质含量判断，G2细胞大约是G1细胞的1.8%；因此，T-SCP正确地反映了细胞的增殖状态，同时突出了在批量样本分析中隐藏的每个细胞周期阶段的异质性(图 4C)。为了能够直接比较单细胞蛋白质组，并消除由于每个细胞的总蛋白量和鉴定不同而导致的蛋白质丰度差异，我们使用搜索引擎DIA-NN提供的跨细胞保留时间依赖的归一化模块对我们的数据进行标准化处理。此外，我们严格过滤了数据集，每个细胞至少有600个鉴定蛋白质，其余单个细胞中每个蛋白质的观察值超过15%。不同细胞周期状态的蛋白质组在主成分分析(PCA)图中聚集在一起(图 4D)。除了这些药物干扰的细胞外，我们还测量了来自两个独立细胞培养批次的200多个未经处理的细胞。这些细胞的蛋白质组在细胞周期状态中分布良好，而不同传代批次的蛋白质组在G1和G2期有所富集。这突出表明，生物变异主导了剩余的技术变异。T-SCP数据集涵盖了分配给许多细胞室、膜和生物过程的蛋白质，这些蛋白质涉及生物调节、新陈代谢、运输和信号转导，尽管严重的系统扰动导致了明显的生物变异和蛋白质组重构。

图4 T-SCP能正确量化细胞周期状态A，药物干扰会阻断单个细胞；B，A中药物处理的231个处于指定细胞周期阶段的细胞的蛋白质鉴定数(虚线表示每个细胞周期阶段鉴定数的中位数)；C，B中单个细胞的总蛋白质信号在过滤每个细胞至少600个蛋白质和每种蛋白质跨细胞15%的数据后的箱线图(G1：n = 84；G1-S：n = 41；G2：n = 52；和G2-M：n = 45)；(箱体和须线；箱体的中间代表中位数，箱体的顶部和底部代表数据的上下限四分位数值，须线表示1.5×IQR)；D，B中单细胞蛋白组的PCA；E，分别基于G1期、S期和G2-M期标记蛋白的受试者工作特征曲线(ROC)以及曲线下面积(AUC)，区分G2-M细胞和G1-S细胞。以G1-S细胞作为G1和S得分的阳性靶点；F，火山图定量蛋白质在两种药物滞留状态的差异。箭头指向彩色的、明显受调控的感兴趣关键蛋白(Benjamini–Hochberg校正的多样本t检验；FDR = 0.05；S = 0.2)；G，CDKN2A相关多肽的定量碎片离子水平数据(FDR < 10⁻¹⁵；Benjamini–Hochberg校正的多样本t检验(箱体和须线；箱体的中间代表中位数，箱体的顶部和底部代表数据的上下限四分位数值，须线表示1.5×IQR)；H，STMN1相关多肽的定量碎片离子数据(FDR < 10⁻¹⁵；Benjamini–Hochberg校正的多样本t检验(箱体和须线；箱体的中间代表中位数，箱体的顶部和底部代表数据的上下限四分位数值，须线表示1.5×IQR)。
接下来，我们研究了单细胞蛋白质组是否可以用于注释细胞状态，类似于单细胞RNA测序(scRNA-seq)的方式。在先前的蛋白质组学研究中，人们发现细胞群因细胞周期状态而富集。在这里，我们选择细胞周期阶段标记蛋白作为G2/M期、G1期或S期蛋白质组中差异表达最大的60个蛋白质组，因为它对批量人群使用了类似的药物治疗，并研究了如何区分不同细胞周期阶段的细胞。我们使用这些标记蛋白来建立细胞周期阶段特定的分数，表明了先前用于scRNA-seq细胞周期阶段预测的可能性。这个模型清楚地区分了G2/M和G1/S时期的细胞。接下来，我们研究了药物抑制的细胞周期阶段G2/M和G1/S之间的差异表达蛋白质。在显著调控的蛋白质中，有大量已知的细胞周期调节因子，我们突出显示其中一些蛋白质 (图 4F)。碎片离子水平的定量MS数据对这些数据具有非常重要的意义，如细胞周期调节因子CDKN2A、STMN1。我们的单细胞数据集也发现了以前与细胞周期和G2/M转变无关的蛋白质。例如，我们明确鉴定出了NA CA蛋白。
5.SC蛋白质组与转录组的比较
给定我们的一组430多个单细胞蛋白质组，我们将过滤后的T-SCP测量结果与类似的单细胞RNA测序数据(scRNA-seq)进行了比较。我们从同一细胞系统上选择了两种广泛使用的scRNA-seq (Drop-seq)和通量较低的SMART-seq2技术。Drop-Seq方法基于唯一分子识别符(UMIs)来控制数据库制备中的扩增偏差，而SMART-Seq2方法不受UMI控制。基于MS的蛋白质组学本质上不涉及任何扩增，也不受相关伪影的影响。尽管有细微的差异，HeLa细胞的培养应该反映了基因和蛋白质表达状态的分布特征。这一假设将使我们能够评估测量技术的自我一致性。首先，我们计算了细胞的所有配对相关系数的分布。我们发现在蛋白质组测量中，细胞的平均相关性高于基于液滴的方法和SMART-Seq2方法，在分析每个特定数据集中的所有可用基因以及分析所有共有基因时也是如此(图 EV4A)。我们比较了基因或蛋白质表达完整性的所有三个数据集后发现，每个细胞的蛋白质表达完整性服从正态分布(图 5A)。此外，当在共有基因水平上比较基因或蛋白质表达的完整性时，SMART-Seq2数据集中的饱和测序效应变得较为明显。两个单细胞RNA测序技术数据集都遵循双模态基因完整性频率分布，而单细胞蛋白质组则不符合。

图5 单个细胞有一个稳定的核心蛋白质组，但没有核心转录组A，T-SCP(细胞 × 蛋白：424 × 2480)、SMART-Seq2(细胞 × 基因：720 × 24990)或Drop-Seq(细胞 × 基因：5022 × 41161)的细胞基因或蛋白表达完整性如小提琴图所示；中间点代表数据集的中位数；B，单细胞基因和蛋白质表达的主成分分析(1672个共有基因)；C，通过蛋白质组学和两种转录组技术(1672个共有基因)测量的单个细胞之间的细胞-细胞相关性热图；D，在基于LC-MS的蛋白质组学中，单细胞蛋白质表达水平的变异系数是“核心蛋白质组”平均表达水平的函数；E，在基于LC-MS的蛋白质组学、SMARTseq2和Drop-Seq技术中，蛋白质和转录组表达水平变异系数的箱线图 (箱体和须线；箱体的中间代表中位数，箱体的顶部和底部代表数据的上下限四分位数值，须线表示1.5×IQR)；F，用颜色编码的蛋白质类别(红色：SUMO2和TDP52L2蛋白质；绿色：伴侣蛋白和折叠相关蛋白质)的核心蛋白质组的排序丰度图。橙色：翻译起始和延伸；黄色：结构蛋白；蓝色：DEAD解旋酶家族成员)。
接下来，我们研究了在蛋白质测量中是否存在检测的系统性限制。我们在蛋白质测量的较低丰度范围内确定了这种检测极限。这表明，除了提高灵敏度之外，我们的单细胞蛋白质分析还可以受益于归因法或基于似然的参数估计方法。对于批量测量，转录水平通常与相应的蛋白质水平适度相关，然而，这种相关性在很大程度上取决于生物状况。在单细胞水平上，这种效应被不同的测量技术以及转录组和蛋白质组之间的基本生物学差异进一步影响。在我们的数据中，scRNA-seq测量可以在多大程度上作为蛋白质测量的替代技术，但在主成分分析中我们发现蛋白质与RNA明显分离(图 5B)。虽然单细胞转录表达水平在单细胞RNA-seq技术之间具有很好的相关性，但它们与单细胞蛋白质测量有所不同(图 5C)。
6.T-SCP揭示稳定的核心蛋白质组
由于蛋白质组和转录组水平之间的相关值不同，我们接下来研究了基因表达作为丰度函数的变异性。对于蛋白质表达的测量，所覆盖丰度之间的变异系数非常小(图 5E)。这与一个模型是一致的，在该模型中，被覆盖的蛋白质组是稳定的，并且在其整个动态范围内可以被稳定的检测。相比之下，对UMI控制和非UMI控制的scRNAseq数据的相同分析显示，单细胞RNA-seq的变异系数与蛋白质测量相比，总体转录组变异性要高得多(图 5D)。值得注意的是，未来基于MS蛋白质组学灵敏度肯定会越来越高。将单细胞蛋白质组与6个细胞蛋白质组进行比较(图 2C)表明，MS灵敏度的适度增加可以定量很大一部分稳定表达的蛋白质组。我们还观察到，单细胞转录组由脉冲噪声主导，具有泊松分布，因为许多转录组的表达平均低于每个细胞的一个拷贝。这意味着一个给定的单个细胞可以有零个、一个或两个其表达基因的转录组，当将许多单细胞测量值相加时，就会导致泊松分布。对于具有较高表达值的基因，每个细胞中总是存在转录产物，然后这些基因的表达分布不是脉冲噪声主导的。相比之下，对于蛋白质，CV仅取决于测量灵敏度，因为每个细胞中总是有足够的副本，以确保它们的表达水平不受生物脉冲噪声的限制(图2A)。基于这些观察，我们在蛋白质组学数据中定义了一个“核心-蛋白质组”子集，方法是选择前200个蛋白质，其中包括受药物干扰的蛋白质，这些蛋白质的CV值最低，在430多个单细胞中至少有70%的蛋白质使共有的。有趣的是，这些蛋白质很好地分布在蛋白质组的动态范围内(图 5D)。值得注意的是，我们在单细胞转录组数据(图 5E)中发现了核心蛋白质组的相应转录产物分布在整个CV范围内。核心蛋白质组突出显示了经常用于标准化的蛋白质，如热休克蛋白90提供了阳性对照(图 5F)。核心蛋白质组的CV排序图还揭示了一组不同的蛋白质集。有趣的是，我们还发现TPD52L2是最稳定的蛋白质之一，而TPD52L2又被描述为HeLa细胞和SUMO2中含量最丰富的蛋白质之一，SUMO2以参与过多的重要调控细胞过程而闻名，这表明即使在蛋白质组重构期间，细胞中也有稳定的SUMO2集合。

讨论

T-SCP管线结合了与超低流量液相色谱耦合的小型化样品制备和新型质谱仪，为单细胞分析带来了至少一个数量级的灵敏度增益和最高的稳定性。我们量化了靶向扰动后的细胞异质性，这使得人们在蛋白质组水平上直接分析单细胞层次上的药物反应成为可能。此外，单细胞RNA和蛋白质组水平的比较表明，蛋白质组是稳定的，而转录组更具随机性，这为在单细胞水平上阐明翻译机制奠定了基础。

虽然这里主要展示了单细胞总蛋白质组的测定数据，但在我们的工作流程中实现的灵敏度在任何样本量受限的情况下都是有用的。这包括对其他化合物类别的研究，如代谢物或药物，来自少量细胞或体内材料的翻译后修饰，以及直接从石蜡包埋的福尔马林固定(FFPE)病理标本进行测量。

我们的离子淌度增强型工作流也与化学多路复用兼容，优点是可以省略或减少导致报告离子扭曲的booster通道，并有利于替代多路复用策略，如互补TMT或EASI-TAG。此外，还有许多机会来提高整体灵敏度，包括更好的离子源、改进的色谱层析分析和建模工具，类似于scRNAseq领域最近的进展。

原文链接：

https://doi.org/10.15252/msb.202110798

----------微科盟更多推荐----------

科研 |台湾大学:集成微流控芯片和数据非依赖性采集质谱的流线型单细胞蛋白质组学

科研 |单细胞和血浆蛋白质组学综合模型预测手术部位并发症：一项前瞻性队列研究(Ann Surg)

如果需要原文pdf，请扫描文末二维码领取

蛋白质组长期接受科研文章/经验投稿，期待与您交流更多蛋白质组学问题

（联系多组学老师即可投稿&申请入群）

请关注下方公众号

了解更多蛋白质组知识

蛋白质组，专注蛋白质组学《蛋白质组》是微科盟旗下专注于学术知识免费分享平台，内容主要包括分享蛋白组学最新文献，新闻，干货知识，视频课程和学术直播讲座。

蛋白质组仅用于学术成果分享与交流，不涉及商业利益。

也严禁他人将本公众号的内容用于商业运营。

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡

桐城一派｜倒在“跨年夜”的龚书记，13个字换来免职调查冤不冤？

比佟丽娅还恋爱脑，怀孕7次流产4次，目睹丈夫背叛却选择原谅

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…

科研 |Mol. Syst. Biol.:超高灵敏度质谱定量单细胞蛋白质组的扰动变化

您可能也对以下帖子感兴趣

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突 认定该生系高空坠落死亡

桐城一派｜倒在“跨年夜”的龚书记，13个字换来免职调查冤不冤？

比佟丽娅还恋爱脑，怀孕7次流产4次，目睹丈夫背叛却选择原谅

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…

生成图片，分享到微信朋友圈

科研 |Mol. Syst. Biol.:超高灵敏度质谱定量单细胞蛋白质组的扰动变化

您可能也对以下帖子感兴趣

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡