其他
科研 |台湾大学:集成微流控芯片和数据非依赖性采集质谱的流线型单细胞蛋白质组学
编译:微科盟-红烧大肥鸥,编辑:微科盟Emma、江舜尧。
微科盟原创微文,欢迎转发转载。
导读单细胞蛋白质组学可以揭示生物过程中的细胞表型异质性和细胞特异性功能网络。在蛋白质组分析研究中,我们提出了一种简化的工作流程,即将微流控芯片用于一体化蛋白质组样品制备和数据独立采集(DIA)质谱(MS),并将该手段拓展到单细胞水平。蛋白质组学芯片能够在单个设备中实现多路复用和自动化的细胞分离/计数/成像和样品处理。结合基于芯片的样品处理和使用特定质谱数据库的DIA-MS,我们在20个单个哺乳动物细胞中平均鉴定出大约1500个蛋白质。应用chip-DIA工作流程分析粘附性和非粘附性恶性细胞的蛋白质组,我们的蛋白质组数据覆盖了5个数量级的动态范围,并具有良好的重复性和小于16%的缺失值。总而言之,chip-DIA工作流程提供了一体式细胞表征、灵敏度和稳定性分析的能力,以及在未来可以在芯片中添加附加功能,从而为单细胞蛋白质组学的应用奠定基础。
论文ID
原名:Streamlined single-cell proteomics by an integratedmicrofluidic chip and data-independent acquisition mass spectrometry译名:集成微流控芯片和数据非依赖性采集质谱的流线型单细胞蛋白质组学
期刊:Nature CommunicationsIF:14.919发表时间:2022.01通讯作者:Yu-Ju Chen & Hsiung-Lin Tu
通讯作者单位:台湾中央研究院化学研究所&台湾大学化学系
实验设计
实验结果
为了给数量有限的样品提供一个简化的微量蛋白质组学流水线,我们设计了一个集成蛋白质组学芯片(iProChip)的微流控装置,提供从细胞输入到完成蛋白质组样品处理的一体化功能。iProChip具有两层、上推的几何结构,可通过程序控制的34个阀门进行精确的流体操作,从而为精确系统控制提供自动化方案 (图1a-f)。该芯片由9个单元组成,使多路蛋白质组实验能够同时运行。每个单元包含一个细胞捕获、成像和裂解室,一个蛋白质还原、烷基化和水解容器,以及一个多肽脱盐柱(图1C)。所有装置共用9个进水口和2个出水口,可以同时输送试剂和处理样品,以增加分析通量。细胞捕获器由10、50和100根楔形双柱阵列组成,间隔5 μm,分别在5、8.5和11个nL室中快速捕获细胞(图1E)。我们制造了一个半径为1 mm,高度为100 μm(312 nL)的圆形腔室,以适应整个蛋白质组工作流程,包括细胞裂解、蛋白质还原、烷基化和水解(图1f)。注意,iProChip的计算表面积体积比大于现有的单电池器件,如NanoPOTS,但与基于微型小瓶的工作流程相比,它的表面积仍显著减少了90%以上。对于多肽脱盐,我们通过将反相C18微珠装入带有5 μm滤片的微通道中来制作了一根横截面为200μm× 25μm且长度为2.5cm的柱子,从而实现了在芯片上的多肽脱盐。为了增加蛋白质组的覆盖率,我们采取了一种分析策略,该策略使用Orbitrap质谱仪集成了direct DIA和基于数据库的DIA分析方法。我们利用由不同蛋白质组组成的癌细胞系或免疫细胞,开发了由混合DDA-DIA数据集互补建立的谱图库资源,该资源可以作为数字图谱,从理论上重现DIA数据的m/z和保留时间范围内的所有肽(图1g)。具体而言,我们对由具有不同细胞数量的细胞系构建的谱图库进行测试和优化,以最大限度地增加已鉴定和定量的蛋白质数量。
在简化工作流程的第一步,细胞捕获效率是使用非小细胞肺癌(NSCLC) PC-9细胞来测定的。使用最佳细胞密度(500个/μL),每个单元所需的细胞数量 (1-100) 可以在10-60 s内被捕获。单细胞捕集器的平均捕获率分别为100、92±3和89±8%。在对包含 1 (~90%) 和2或3个细胞 (~10%) 的凹槽进行计数后,我们发现所有单元的目标捕获效率达到了100%,本研究将其视为一个可绝对量化的模块,以执行简单和快速的细胞分离(图2a, b)。与独立的细胞分选器相比,这种内置模块提供了简单、快速和高效的细胞隔离。我们还发现使用在 3 psi 下运行的较低细胞密度(25个细胞/μL),这种细胞区室允许在 1和5个细胞水平上精确捕获较少数量的细胞。我们还评估了 iProChip 的细胞捕获能力,以表征细胞使用效率(定义为被捕获细胞的数量/总输入细胞的数量)和 iProChip 操作所需的最小细胞数量。本研究使用共5或10μL细胞溶液(25个细胞/μL),结果表明,捕获 1-100 个细胞的细胞使用效率范围为4%~44%。接下来,我们试图测试在细胞裂解和蛋白质水解过程中试剂是否可以在封闭容器中有效混合。本研究测试了三种混合方法,包括涡旋、振荡(板式振荡器)和被动扩散。利用成像分析,我们计算相对混合指数(RMI)来评估混合性能。结果表明,涡旋、振荡和扩散混合需要 11、16 和 30 分钟才能达到 75% RMI,这表明所有三种混合策略都足以在反应动力学的几分钟到几小时内适应反应,这符合进行蛋白质组学工作流程的时间(图2 c, d)。虽然发现涡流混合的速度更快,但由于其处理灵活性和足够的反应时间尺度,我们在后续实验中采用了这种振荡混合方式。
小型化设备的另一个集成是芯片上的多肽脱盐模块(图2e)。我们通过处理约10个细胞来评估脱盐的有效性,其中脱盐样品的谱图显示出可重复的多肽离子谱图轮廓,而未脱盐的样品则显示出洗涤剂的色谱峰。脱盐模块的负载能力和多肽回收率(%)显示出从0.125~1 μg的线性相关性,回收率约为89%(图 2f)。假设一个典型的哺乳动物细胞含有200 pg蛋白质,预计脱盐柱的容量可以从大约4000个细胞中捕获多肽。此外,我们通过使有色染料流过C18微珠填充柱来评估由于优先流而导致的损害样品回收。结果表明,9psi是克服优先流的最小流量压力。
2. iProChip与DIA MS的集成
为了在蛋白质组学工作流程中操作 iProChip,我们使用内置细胞捕获器捕获精确数量的细胞,包括 1、5、10、50 和 100 个细胞。通过分配和孵育含有 RapiGest、三(2-羧乙基)膦(TCEP) 和氯乙酰胺 (CAA) 的缓冲液,我们对捕获室中捕获的细胞进行同时处理,该缓冲液特别适用于单管的细胞裂解、蛋白质还原和烷基化以最大程度地减少样品损失。随后在反应容器中蛋白质发生水解和酸化,水解后的多肽通过C18柱进行15分钟的脱盐。在每次实验之前,细胞区室和反应容器都涂有牛血清白蛋白 (BSA),这可以尽量减少肽的吸附损失。对于后续的液相色谱(LC)-MS/MS 分析,我们优化了单次 DIA-MS 采集参数,包括隔离窗口、分辨率、多肽上样量和LC-MS/MS梯度,以提高少量细胞的蛋白质组学覆盖率。为了利用DIA对低丰度和癌症相关蛋白进行深度分析,我们使用肺癌和人类慢性淋巴细胞白血病(CLL)细胞系构建了高质量的特异性谱图库。包含数千个细胞和单个细胞的大量样品中蛋白质组成和动态范围可能会有所不同,这可能会影响色谱保留时间和DIA采集。因此,我们从各自的细胞类型(即PC-9和MEC-1细胞)构建了大规模(1μg)和小规模(~10个细胞)数据库,并利用它们分析不同数量的细胞。具体来说,我们采用DDA和DIA模式进行批量/稀释处理PC-9和MEC-1中的大型特异性谱图数据库,这些数据库分别由6345个蛋白质(83305个肽)和6261个蛋白质(60335个肽)组成,母离子和蛋白质FDR值为1%。这些大型数据库可用于分析更高数量的细胞(即>10个细胞)。对于较低的输入样本(即5个和单个细胞),我们推断小规模的特异性数据库应该有利于鉴定和定量。为了最大限度地提高单细胞水平的蛋白质组分析灵敏度,我们从通过iProChip处理的10个细胞以及通过批量/稀释处理的约1.5ng(约10个细胞)等分试样构建了小型谱图库,得到2231个蛋白质(14054个肽)和2440个蛋白质组(11720个肽)。为了评价基于DIA的iProChip定量性能,我们系统研究了iProChip处理13-14个PC-9细胞在灵敏度、蛋白质组覆盖和重现性方面的优点,并与传统的DDA方法进行了比较(图3a)。本研究中所有数据集的鉴定和定量分析都是按照严格的统计学标准下进行的,即多肽谱图匹配(PSM)和蛋白质的FDR值设为1%。通过DDA方法,我们在三次重复分析中平均鉴定出869个蛋白组(3280个多肽)。相比之下,使用Spectronaut工具的直接DIA (dirDIA)方法鉴定出了1409个蛋白质(5174个肽段),而使用大规模PC-9细胞数据库辅助DIA (libDIA)方法鉴定出更多的1874个蛋白质(6929个肽段)。比较dirDIA和基于谱图数据库的结果,libDIA的卓越定量性能可能是因为DIA模式可以更有效地检测低强度的肽离子,并能与数据库中相应的多肽质谱图相匹配。结合互补的dirDIA和libDIA结果,该方法整体鉴定范围进一步扩大到2022个蛋白质(7757多肽)。DIA方法鉴定的蛋白和多肽数量是DDA的2.3倍和2.4倍,因此DIA比DDA方法具有更好的图谱覆盖度(图3a)。这些结果表明,基于dirDIA的LC-MS /MS,辅以dirDIA和libDIA的互补策略提高了iProChip中全自动样品制备的小样本的蛋白质组鉴定覆盖率。
为了评估iProChip-DIA工作流程的重现性,我们计算了14个PC-9细胞的三次重复分析之间重叠蛋白质的百分比。结果表明,DIA和DDA分别可重复检测到2022种已鉴定蛋白质中的84.2%和869种已鉴定蛋白质中的71.7%,表明iProChip-DIA方法具有更高的重现性和蛋白质组覆盖率(图3b)。在CV≤20%的可重复性定量评价中,与DDA测定的522个蛋白相比,DIA测定的1160个可定量蛋白的覆盖率显著更高(图3c)。以前的无标记定量方法通常存在10-50%的LC-MS运行缺失值,这是跨样本可重复定量的瓶颈。我们对组间变量进行比较并发现与DDA(28%)相比,在一个重复组中DIA定量的蛋白质数量 (16%)与DDA结果(28%)相比缺失值更少(图3d)。同时,蛋白质组组成的宽动态范围是深度分析的另一个瓶颈,特别是对于低丰度蛋白质。因此,我们根据蛋白质丰度等级评估了动态范围。通过DDA,我们发现1014种已鉴定蛋白质的丰度跨度约为4个数量级,而DIA中已鉴定的2170种蛋白质跨度约为5个数量级,涵盖了与癌症相关的重要和低丰度癌蛋白。值得注意的是,FDA批准的肺癌药物靶点,如EGFR、MAP2K1和MAP2K2,以及参与NSCLC通路的蛋白质,包括EGFR、NRAS、MAP2K1、MAP2K2、MAPK1、MAPK3、CDK4和TP53,很容易在DIA中识别出来。而我们的方法在DDA中只检测到TP53和CDK1(图3e)(https://www.cancer.gov/about-cancer/treatment/drugs/lung)。总之,DIA方法在14个细胞水平上比DDA提供了更高的蛋白质组分析覆盖率、更低的缺失值、可重复性定量性能和更宽的动态范围。
3. 通过iProChip和DIA-MS对微量样品进行定量蛋白质组分析
接下来,我们系统地评估了iProChip-DIA在具有10、50和100个捕捉器的腔室中对PC-9细胞进行蛋白质组学分析的性能。正如预期的那样,iProChip为每个腔室提供精确的细胞计数,以确保能进行精确的定量(图4a)。结合libDIA和dirDIA分析,在1%FDR下,我们在106±2个细胞的三次分析中平均鉴定出4722±10个蛋白质(25785个肽)。在细胞数量较少的腔室中,我们分别从55±1、14±1和低至5±1个细胞中平均鉴定出3435±262、2022±114和1638±191个蛋白质(图4a)。三次重复分析中鉴定的蛋白质重叠率为77-93%,说明iProChip-DIA方法具有高重现性。重要的是,为了表征实验的测定重现性,我们在独立芯片中处理了另一批10个细胞样品。结果显示两个批次的蛋白质鉴定结果水平相似,批次内重叠率为78-84%,批次间重叠率为71%,说明各批次之间的重复性较好。
由于受到灵敏度的鼓舞,我们使用10细胞捕获室进一步提高了单个PC-9细胞的分析灵敏度。我们从单个PC-9细胞的三次重复分析中平均鉴定出976±37个蛋白质(3069个肽)(图4b)。通过比较鉴定覆盖率,我们发现在三次重复结果中,69%的蛋白质组和55%的肽段是常见的。为了评估单细胞测量的背景,我们使用iProChip为所有样品制备步骤制备空白对照样品(无细胞上清液)并进行分析。与来自类似研究的88种蛋白质的平均值相比,我们平均58种蛋白质的结果表明来自空白样品的蛋白质相对较少。1细胞和5细胞样品之间存在显著重叠,两者与空白样品的重叠程度最小。这些结果表明该方法具有较低的交叉污染和错误鉴定率。为了将iProChip与批量样品处理进行比较,我们直接处理了小瓶中的约100个细胞,每个细胞中平均只有86个蛋白质组。我们通过注射1.5ng(~10个细胞)和15ng(~100个细胞)的小等分试样进行DIA分析,与稀释处理的小瓶(~50μg裂解物)进行了比较。虽然结果显示iProChip和稀释制剂中15ng的蛋白质和肽的鉴定量相当,但当1.5 ng时,我们从iProChip工作流程中获得了2倍以上的鉴定结果。iProChip对少量的细胞的这种更高鉴定性能进一步验证了我们的方法对有限细胞的效率。此外,当将数据(1-106个细胞)与常规蛋白质组学样品(~1μg PC-9,~6000个细胞,>6000个蛋白质)进行比较时,使用iProChip从少量细胞(1 - 106)中鉴定出的蛋白质有90-96%是常见的。用iProChip捕获的大量蛋白质部分显示出与细胞数量相关的增加趋势。来自1µgPC-9细胞的这6000种蛋白质中有75%是从iProChip处理的106个细胞中鉴定出来的,这表明我们在小样本规模下可以进行类似体积的鉴定。对蛋白质丰度的进一步分析表明,在少量细胞中发现的大部分高丰度蛋白质表明在少量细胞样品中检测低丰度蛋白质的确有较大的挑战。为了评估定量蛋白质组学方法的分析重现性,我们采用两两相关分析方法对三份数据集中的蛋白质丰度进行了定量比较。结果显示,通过我们的iProChip-DIA工作流程(图4c)测量的蛋白质丰度具有良好的重现性(Pearson相关性为0.88-0.98)。为了评估定量性能,我们计算了在每个细胞数中量化的总体蛋白质丰度的分布,这显示了不同细胞数之间的对数线性相关性(图4d)。本研究在单个蛋白质水平上进一步评估了定量蛋白质组分析的能力。代表性的例子选自肺癌相关的癌蛋白,我们根据Spectronaut计算它们的丰度。代表性肺癌蛋白EGFR、CDK1和MAP2K1的平均丰度与增加的细胞数量之间呈现良好的线性关系(图4e)。许多量化的蛋白质,例如TP53、ITGB1、PGK1和MAPK1,在蛋白质丰度和细胞数量(1-106个细胞)之间表现出良好的定量依赖性(50-100倍)(图4e)。与上述定量性能一致,iProChip-DIA能够实现高度的稳定性、良好的重现性和低至单细胞水平的蛋白质组学定量能力。这些蛋白质的鉴定使我们能够根据KEGG数据库中绘制出肺癌相关的信号通路。本研究总共富集了329条通路,例如NSCLC通路、代谢通路、癌症中的通路、剪接体、病毒致癌、癌症中的蛋白聚糖、MAPK信号传导和细胞凋亡。肺癌的主要通路,NSCLC通路,在不同数量的细胞中覆盖了总共29种蛋白质(图4f)。即使在少量细胞(14±1个细胞)下,我们也鉴定出了13种蛋白质,包括药物靶向EGFR、MAP2K1、MAP2K2、MAPK1、MAPK3和KIF5B、肿瘤抑制因子TP53和其他关键信号成分(KRAS、CDK4、CDKN2A、EML4、KIF5B、NRAS、BAX和RB1)(图4f)。就灵敏度而言,EGFR、MAPK1、MAP2K1、MAP2K2、CDKN2A、TP53、KIF5B和GRB2蛋白仅在5个细胞中被检测到,而MAP2K1、KRAS和TP53甚至可以在单细胞水平上检测到(图4f)。基于肺癌模型研究,这些结果揭示了所开发的方法具有蛋白质覆盖的能力,并能在有限的细胞数量下研究癌症蛋白质组和广泛的细胞途径。
4. iProChip-DIA 在白血病单细胞蛋白质组学分析中的应用
接下来,我们在人B-CLL细胞株MEC-1上验证了iProChip-DIA平台的普遍适用性。从方法学开发的角度来看,代表异质癌症类型的白血病细胞是开发灵敏蛋白质组学工具的理想模型,因为它们可以通过描述表型功能的系统范围概况来轻松补充各种现有方法。当在芯片上处理MEC-1细胞时,iProChip的细胞捕获功能显示MEC-1细胞明显小于PC-9细胞。我们使用MEC-1谱图数据库结合dirDIA和libDIA,通过iProChip-DIA对MEC-1细胞进行三次重复分析,在FDR为1% 的情况下从117±1、14±1以及单个细胞平均得到3811±362、931±72和455±98个蛋白质,(图5a)。我们发现蛋白质丰度跨越约5个数量级,并从单个细胞中检测出重要的B细胞表面标志物CD20和HLA分子(图5b),而从14和117个细胞中鉴定出其他关键蛋白质,包括CD19、CD22、CD47和CD74(图5b)。UniProt的功能注释表明,我们从单个MEC-1细胞数据集中鉴定出许多与适应性免疫、先天免疫、激酶、磷酸酶和Ig结构域相关的蛋白质,其中蛋白质覆盖的深度与细胞数量呈正相关(图5c)。通过绘制保存在KinMap中的518种人类激酶,我们在激酶系统发育树的所有分支中鉴定出114种蛋白激酶,例如酪氨酸激酶(TK)、TK样激酶、丝氨酸/苏氨酸蛋白激酶、酪蛋白激酶1(CDK1)、和Ca2+/钙调蛋白依赖性蛋白激酶(图5d)。虽然MEC-1细胞比PC-9细胞小,但我们通过使用iProChip-DIA方法实现了良好的蛋白质鉴定覆盖率和重叠程度(61-81%),表明我们的平台对不同细胞类型的通用性和稳定性。
B细胞受体(BCR)信号转导对建立有效的适应性免疫至关重要,并参与B- CLL中恶性B细胞的生存和生长。B细胞的活化是通过BCR表面受体复合物和特异性抗原之间的相互作用来调控的。iProChip-DIA方法可以定位到BCR通路中83%的蛋白质和关键的BCR共受体,包括CD19、CD21、CD22和CD81。与 Rieckmann 等人使用 28 个原代造血细胞群在超过10000个蛋白质的深度进行的人类免疫细胞蛋白质组学研究相比,从 MEC-1 细胞中鉴定的4211 种蛋白质中有93%是相同的,另外还有 309 种蛋白质在本研究中是被唯一鉴定的。包括相当数量的关键B细胞表面受体,如CD19、CD21、CD22、CD81、FcgRIIB和Igβ41。我们进一步将我们的数据与Johnston等人的B细胞白血病细胞进行了比较。尽管MEC-1细胞系也属于人类B细胞白血病,但通常只有51%的蛋白组在两个数据集之间发生重叠。根据人类蛋白质图谱数据库(https://www.proteinatlas.org/),常见或独特的蛋白质可能是由细胞类型依赖的蛋白表达。尽管如此,B细胞标记物(如CD19、CD20和CD22)在这两组数据中可以被普遍检测到,而在我们的PC-9数据中未检测到。同样,肺癌标志物(如EGFR和TP53)在MEC-1细胞中未被检测到。这进一步支持了蛋白质表达依赖细胞特异性的概念。综上所述,这些结果证明了该方法的通用性,即该方法可以对不同类型的细胞进行深入的蛋白质组学表征,从而为在肿瘤微环境等复杂系统中解剖细胞异质性铺平了道路。
5. 通过单细胞集成蛋白质组学芯片 (SciProChip) 和 DIA MS 提高灵敏度
受iProChip在蛋白质组覆盖和定量方面结果的启发,我们接下来寻求实现专门用于单细胞20重处理的iProChip,我们将其称为单细胞iProChip (SciProChip)(图 6a,b)。该SciProChip包括20个腔室,每个腔室都包含一个单细胞捕捉器,以便于精确地捕获一个细胞进行蛋白质组处理(图6c)。该芯片显示,通过优化细胞捕捉器的位置和更窄的腔体尺寸,单细胞捕获率提高了~40%(图6d)。与iProChip相比,本芯片的总处理量从312 nL减少到78.5 nL,C18填充柱的长度从2.5减少到1 cm,这都有助于减少样品损失。为兼容其它小细胞,我们将LC-MS/MS梯度时间缩短至90 min。
通过使用SciProChip,我们接下来使用两个芯片对从两批细胞培养物中获得的一系列单细胞进行蛋白质组分析。每个批次包含10个单细胞,我们在20个单细胞中可重复鉴定出约1500±131个蛋白质。与iProChip的单细胞分析相比,SciProChip获得了显著提高(1.53倍)的蛋白质组覆盖率(图6e)。我们分别从含由10个单细胞的批次中鉴定出1792和1995个蛋白质。所鉴定的蛋白质在单细胞运行之间实现了良好的重叠(81%-86%),表明SciProChip-DIA工作流程的高重现性(图6f)。接下来,我们通过计算每个单细胞中的总蛋白质丰度来评估单细胞重复的定量性能,结果显示所有数据集上都有一致的蛋白质丰度对数分布(图6g)。我们通过计算重复样本间蛋白质丰度的配对相关性来评估重现性,并显示出良好的Pearson相关性(图6h)。我们进一步探索了单细胞水平上细胞大小和已鉴定蛋白质组之间的潜在相关性。结果显示鉴定的蛋白质数量似乎与单个细胞的大小无关(图6i)。总之与iProChip相比,SciProChip展示了更高的细胞使用效率和显著提高的蛋白质组覆盖率,同时保持了单细胞蛋白质组轮廓的良好再现性。
讨论
https://doi.org/10.1038/s41467-021-27778-4
----------微科盟更多推荐----------
综述 |Annu Rev Biophys:蛋白质测序,一次一个分子
科研 (IF:16.971) |Nucleic Acids Res.:人类Proteoform图谱
如果需要原文pdf,请扫描文末二维码领取
蛋白质组长期接受科研文章/经验投稿,期待与您交流更多蛋白质组学问题
(联系多组学老师即可投稿&申请入群)
请关注下方公众号
了解更多蛋白质组知识
蛋白质组仅用于学术成果分享与交流,不涉及商业利益。
也严禁他人将本公众号的内容用于商业运营。