查看原文
其他

单细胞测序文献精读05 | 用冷激活蛋白酶分离实体肿瘤组织用于单细胞RNA测序可以最小化保守胶原酶相关的应激反应(视频)

联川生物 2022-05-21

The following article is from 珠江肿瘤 Author 杨苏晋


用冷激活蛋白酶分离实体肿瘤组织用于单细胞RNA测序可以最小化保守胶原酶相关的应激反应

Dissociation of solid tumor tissues with cold active protease for single-cell RNA-seq minimizes conserved collagenase-associated stress responses

(Genome Biol. IF=14.028)

(视频讲者为 南京医科大学:杨苏晋)



摘要

背景:

单细胞RNA测序(scRNA-seq)是研究肿瘤异质性、组织微环境等复杂生物系统的有力工具。然而,原发实体肿瘤组织和病人组织异种移植小鼠模型的单细胞RNA测序技术和生物学变异的来源尚不清楚。


结果:

我们使用低温(6°C)蛋白酶和胶原酶(37°C)来识别不同单细胞RNA测序数据集中与组织解离相关的转录特征,这些数据集包括155165个来自患者癌症组织、患者来源的乳腺癌异种移植物和各种细胞株。我们观察到细胞活力的标准质量控制指标在不同的条件和组织中存在很大的差异。对比37℃和6℃下的组织蛋白酶解,我们观察到胶原酶消化导致的应激反应。我们得到了一个核心基因集,包含512个由胶原酶(37°C)诱导的热休克和应激反应基因(包括了FOS和JUN),冷激活蛋白酶(6°C)可以使得上述基因的解 离最小化。虽然诱导的这些基因的在所有细胞类型中都高度保守,但在患者组织中观察到因为细胞类型的特异性而产生的不同的胶原酶消化反应。


结论:

肿瘤组织解离的方法和条件影响细胞的产量和转录组状态,并同时依赖于组织和细胞类型。在癌症单细胞研究中,表面免疫识别成分如MHCI类在应激通路中产生的表达差异的说明可能尤其令人困惑。我们定义了512个核心基因,这些基因可以帮助在分离的单细胞RNA测序实验中识别这些效应。



前言


测序技术的最新进展使得RNA测序可以单细胞分辨率进行,可以用来研究肿瘤组织的功能,包括了瘤内异质性等微环境架构、克隆动力学、已知和新细胞类型的测量,这是大部分测序所不能完成的。


由于单细胞RNA测序的敏感性,基因表达的微小变化会极大地影响生物数据的解释。单细胞RNA测序数 据还受到技术噪声和生物噪声的影响。转录组的固有特性是短暂和动态的,反映了细胞对环境的快速反应能力。此外,单个细胞的转录行为可能与整个群体特征严重偏离,基因表达脉冲模式已被证明对单细胞RNA测序数据具有显著的噪声水平。组织组成、细胞质量和细胞细胞变异性的固有变化也会使对单细 胞RNA测序数据的解释变得困难。

高质量的单细胞RNA测序数据需要具有最少的细胞外成分以及可高水平存活的单细胞悬浮液。

固体组织的标准样品制备方法需要酶解和机械离解,根据组织起源、密度、疾病状态、弹性蛋白或胶原蛋白含量,可能需要长时间的酶解和/或剧烈的机械破坏。转录机制在37°C时仍然活跃,在高温下延长培养时间可能会引入基因表达伪影,而与收获时的生物学表型无关。此外,在无营养或无固定的情况 下,在较高的温度下延长培养时间,或进行剧烈的解离,都可能导致细胞凋亡或细胞死亡,污染活细胞群或产生低质量的单细胞悬浮液。因此,研究细胞分离方法对组织转录组特征的内在变化和潜在影响势在必行。最近有研究表明,从喜马拉雅冰川细菌地衣芽孢杆菌(Bacillus lichenformis)中分离出的丝氨酸蛋白酶(subtilisina)可在4-6℃条件下解离非恶性肾组织,并可减少这些组织单细胞RNA测序的伪影,降低整体和单细胞基因表达的变化。我们试图确定温度对酶解离的影响。使用包含48个样本和155165个细胞的不同细胞RNA测序数据集,这些细胞包括患者癌症组织、患者来源的乳腺癌异种移植(PDXs)和癌细胞系。我们强调了样本间细胞 RNA测序的质量控制指标和患者肿瘤样本组成中细胞类型的内在变化。我们确定了一个死细胞的亚群, 这个亚群不会通过标准的数据过滤操作被移除,并可以量化它们的转录组与活细胞的差异程度。我们进一步鉴定了一个代表转录死亡细胞的亚群,表达增加的主要组织相容性复合体(MHC)类I基因。我们确定了一组与胶原酶解离相关的即时、热休克和应激反应基因,它们在细胞和组织类型中高度保守,在低温下可以使这些基因的解离最小化。这些发现可能会对单细胞RNA测序数据的生物学解释产生重大影响,在分析单细胞实验时应慎重考虑。


结果

01

155165个细胞的单细胞RNA测序

 

 

1 本研究中48个单细胞实验概况。


1a 这张示意图显示了在这个数据集中用于生成48个单细胞实验的各种细胞来源。1b 数据集中每个样本的细胞状态、底物、癌症类型、解离温度和组织状态的描述。1c 在所有的实验中,三个关键的质控指标(检测到的基因数量、与线粒体基因组对应的计数百分比、UMIs序列的数量)都有显著的变异性。1d 用均匀流形近似和投影(UMAP)将48个单细胞实验嵌入到低维投影中。

 

分析:

为了揭示转录变异和对解离方法的反应,我们使用10x Genomics Chromium v3平台生成了155165个细胞的单细胞RNA测序数据,这些数据跨越一系列底物、癌症类型、解离温度和组织状态(图1)。

单细胞RNA测序使用细胞包括:患者样本、PDX,、卵巢癌细胞株、淋巴细胞株、乳腺癌细胞株。新鲜的 和可用的冷冻样品在37°C或6°C进行解离,不同的细胞株在6°C、24°C、37°C、42°C进行解离(图1)。我们在48个测序实验中检测一组常用质量控制(QC)指标:包括检测到的基因数量映射到线粒体基因组的 百分比、UMIs序列的总数 (图1 C)。


S1三个公开数据库中使用了10X基因组平台检测了单个细胞的线粒体基因占总检测基因的百分比。这 些数据集包含了在低检测数量基因中明显增加的线粒体基因比例。

S2 研究中所有单细胞RNA测序样本中被鉴定为小鼠的细胞的百分比在数据集中是高度可变的。

这些高度可变的细胞绝大多数在PDX样本中检测到,但也有一小部分可以在细胞系和患者原发肿瘤样本 中检测到,这表明检测方法要么污染程度低,要么假阳性率不高。

S3  本研究中所有PDX 单细胞RNA测序的质量控制指标(线粒体基因计数%、总检测数、所有检测到的基因)。

尽管数据集间存在显著的差异,小鼠细胞在所有三个指标上得分较低。

分析:

(1) 我们观察到这些指标存在显著差异,特别是线粒体基因百分比的模式分布在不同的样本中存在显著的不同。

在公开的数据集中也观察到这种线粒体基因百分比的变化 (图S1)。

(2) 考虑到PDX样品中可能存在鼠间质细胞污染的可能性,我们根据排列指标将细胞分为小鼠和人 类。在99,244个被测序的PDX细胞中,4942个被鉴定为小鼠细胞,其样本间差异较大(图S2)。

(3) 原发肿瘤和细胞系样本中有372个细胞被误诊为小鼠细胞,有69,608个被鉴定为人类的细胞,这  表明这种检测是否为小鼠细胞的方法有0.5%的假阳性率。

(4) 小鼠细胞在一系列标准质控指标(线粒体计数百分比、检测到的总基因、检测到的总UMIs)中与人 类基因组比对时始终得分较低(图S3)。


02

活细胞、死细胞、垂死细胞的转录组概述

2 活细胞、死细胞和垂死细胞的转录组构成。

2a流式细胞仪分析显示不同的细胞构成:活细胞(PI−/annexin V−)、TNFα处理的垂死细胞(PI/annexin V+)、死细胞(PI+/annexin V+)。

分析:

(1) 在本研究的48个实验中线粒体基因的分布百分比,以及之前研究中发现的结果显示:线粒体基因含量高表明细胞是死细胞或者垂死细胞。我们在图1中观察到促进死细胞或者垂死细胞出现的变化的质量控制指标。(2) 我们使用TNF-α来制造细胞的经典细胞死亡通路,细胞使用以下两种:非致瘤的淋巴母细胞样细 胞系GM18507、基于PI/annexin V 阳性通过流式细胞术分选出的死细胞或者垂死细胞。(3) 值得注意的是,能够用于单细胞RNA测序数据的细胞数量高度依赖于细胞状态,与3000个细胞的 目标数量相比,我们获得了8597个活细胞,1280个死细胞和885个垂死细胞。 
2b三种细胞状态的PCA投影,显示细胞按照三种不同的状态近似沿第一主成分(PC1)的分离,活细胞和死细胞在较低的PC1值时富集,而死细胞在较高的PC1值时富集。2c按线粒体基因所占百分比着色的PCA投影,结果显示了PC1的显著增加。2d与活细胞和垂死细胞相比,已经死亡的细胞在转录组中的线粒体所占基因比例明显更高。

分析:

(1) 校正后的主成分分析(PCA)表明,尽管重叠具有高度异质性,但根据细胞的三种不同状态,细胞大致沿着第一主成分(PC1)分离 (图2b)。

(2) PC1追述了细胞的线粒体基因含量(图2c),如图2d所示,死亡细胞的线粒体基因含量(中位数为

29.9%)显著高于垂死细胞(中位数为3.13%,p = 1.17e−126)和活细胞(中位数为3.4%,p =4.65e−153)。这一观察证实了可以通过排除线粒体基因含量非常高的细胞来去除死亡细胞的做法。



2e 基因表达谱的无监督聚类分析将细胞分为三组,显示了PC1数据和转录组线粒体基因百分比。2f 每个集群的组成:集群1主要由活细胞组成,簇2主要由活细胞、垂死细胞和死亡细胞组成,集群3主要由死亡细胞组成。2g 转录组线粒体基因百分比在三个簇之间存在显著差异,簇1到簇2,簇2到簇3的比例逐步增加。2h MHC I类基因集在簇2中显著上调,提示其代表应激或凋亡前细胞。

分析:

在观察到不同细胞状态下的转录组并非完全不同后,我们进一步研究了转录组状态之间的混合程度,以及活细胞和死细胞是否在转录组上出于“健康”状态。(1) 使用层次聚类我们将细胞聚类成三组,按照PC1数据显示(图2e)。这些三组显示不同的细胞组成: 集群1主要是由活细胞组成(86%活细胞, 8.5% 垂死细胞, 5.1%死细胞)、集群2增加了垂死死亡和死细胞的比例(68%活细胞,7.5%垂死细胞,24%死细胞)、集群3主要由死细胞组成(5.9%活细胞,6.7%垂死细胞,87%死细胞)。 (2) 我们还观察到集群之间的线粒体基因含量出现了一个阶梯式的变化(图2g),其中集群1的线粒体基因含量最低(中位数为3.13%),而集群2的线粒体基因含量有所增加(中位数为26%),集群3的线粒体基因 含量显著增加(中位数为82.2%)。(3) 这些聚类之间的差异表达分析显示,与聚类1和3相比,聚类2中与压力相关的通路如MHCI类(图2h)显著上调。MHC I 类基因参与抗原递呈T细胞,在多种细胞类型中表达,能在应激刺激下诱导表达, 并含有热休克诱导元件。(4) 这些结果显示模型:集群1代表转录组“健康”的细胞;集群2代表转录组中的应激细胞:增加了线粒体基因所占比例集群3代表转录组的死细胞:大多数线粒体基因都被转录(5) 被归类为存活、垂死或死亡的细胞在所有的三个集群中都存在,这表明细胞的转录组状态不一定与表面标记状态相同(尽管两者是相关的)。这些概念让人联想到单细胞发育生物学中的“伪时间”,通过转录组对细胞进行发育排序,可以导致早期或晚期细胞被置于伪时间轨迹上的可变位置。图2a中的PC1通过数据形成一个近似的伪时间轨迹,它随着PC1值的增加追踪显示了转录健康细胞到转录死亡细胞的过程。

2i    通过对集群1中转录组“健康”细胞的差异表达分析,可以发现活细胞和死细胞之间的残差。2j    集群1(x轴)和集群2(y轴)进行对比分析:与组间表达方差相比,集群1中活细胞和死细胞的绝对效应大小(数倍变化)的分布表明,活/死排序对转录组的剩余效应较小。与集群1(x轴)和集群2(y轴)相比, 集群1中活细胞和死细胞的绝对效应大小(数倍变化)的分布表明,与组间表达方差相比,活/死的分类对转录组的剩余效应较小。

分析:

我们进一步确定在健康的转录组中,已分类的死亡细胞与已分类的活细胞是否仍然有区别。(1) 使用集群1中的细胞,进一步对它们进行细分,通过一组严格的质控标准(至少检测到103个基因,线粒体含量百分比在1到10之间),并对这组中按活细胞和死细胞分类的细胞进行差异表达分析。(2) 在保留用于分析的10537个基因中,有2130个(20.2%)被发现有差异表达(图2i),包括IFITM1在死 亡细胞中的下调。(4) 为了将这种类型的变异与集群间转录组变异进行比较,我们在集群1和集群2之间进行了第二次差异表达分析,发现10933个(80.8%)基因中有8835个存在显著差异表达。(5) 图2j中绝对效应大小的结果显示,集群间比较的效应大小显著大于集群内比较的活-死效应大小。综上所述,这些结果表明,尽管在集群1中,已死亡和存活的分选细胞之间存在基因表达差异,但与转录组应激的不同集群相比,表达差异的幅度较小。


03

在37°C条件下,胶原酶的解离可以诱导单细胞转录组产生明显的应激反应

S6 6℃或37℃下进行消化分解的原发肿瘤样本的微环境组成。

结果显示,在卵巢癌患者样本中T细胞和细胞毒性T细胞的数量增加。尽管肿瘤样本的组成是可变的,在 所有的样本中没有发现不同细胞状态之间存在相一致的差异。

分析:

为了揭示消化的温度对转录组的影响,我们对23731个细胞进行了差异表达分析,这些细胞是在6℃或37℃的PDX或细胞系中进行的测量结果的汇总。当我们发现组成细胞类型的产量受到消化温度的影响时,我们去除了那些与原发肿瘤相对应的样本,它们会混淆差异表达的结果(图S6)。

3   胶原酶在37℃下解离,在23731PDX样品细胞中诱导了明显的应激反应,在6℃下解离使应激反应最小化。

3a   在6℃和37℃条件下进行消化的11,975个基因中,细胞间差异表达倍数变化最大的前40个基因的图示。3b UMAP图中23731个细胞根据消化温度的不同进行染色(上图),然后将三个关键的应激反应基因(FOS、JUNB、NR4A1)进行归一化分析,结果显示温度与诱导生成的应激基因特征具有明显的一致性。

分析:

(1) 在保留所有细胞中至少10个计数的基因后,根据样本的不同来源,我们使用edgeR进行了差异表达分析。结果显示,在分析的19,464个基因中,11,975个基因有差异表达(62%),它们的本杰明-霍克伯格(BenjaminiHochberg-corrected false)错误发现率(FDR) 为5%。我们发现了一组被消化温度显著影响表达的核心基因,其表达差异如上所示,但其差异倍数的变化至少为1.5倍。(2) 因此,一个基因要被纳入这些标准,它必须有差异的表达并且根据消化温度的不同它的丰度至少增加或减少50%。这产生了一个核心的基因集,共有512个基因,其中507个基因在37℃时上调,其余5 个基因在37℃时下调。该基因集包括多个典型的应激相关基因,如FOS、FOSB、ATF3和热休克蛋白(HSPs) (3a),其表达已被证明是在肌肉细胞的一个亚群中由胶原酶进行解离时诱导表达生成的。(3) 将解离温度染色的细胞和几个关键基因(FOS、JUNB、NR4A1)的表达进行UMAP分析,进一步证实了这些基因在不同消化温度下的特异性表达(图3b

S4   MDA-MB-231细胞在不同消化温度下热休克蛋白(HSP)基因的表达。


分析:

大量的HSP蛋白在37℃的胶原酶消化中显著上调,我们检测了它们在不同温度(6℃、24℃、37℃、42℃)培养的MDA-MB-231样品中的表达。512个核心基因集中的HSP基因增加的表达水平在孵育温度为37 - 42°C时出现了阶梯式上升,而不是根据温度上升而随之逐渐增加的,这可能表明HSP基因在37°C胶原酶消化时的诱导表达,是由于另一个不同机制,而不仅仅是消化温度。3c 通路MSigDB标志基因的差异表达基因分析显示出:参与NF-κB信号通路、在37°C被诱导生成的200个基因中,46.5%的基因在通路注释中被发现属于512个核心基因集。

分析:

我们对差异表达的结果进行了通路富集分析,在给定的标志通路中发现富集的基因(图3c)。5 PDX胶原酶相关核心基因集的512个基因中,差异表达倍数变化最大的前40个基因的通路示意图。

分析:

通过NF-κB诱导的TNF信号通路中的基因,其中46.5%的注释基因包含在512年的核心基因(图S5)。应激相关通路(包括缺氧、凋亡和炎症反应)的进一步富集表明,在37℃下胶原酶消化可诱导单个细胞的转录 组产生应激反应。

04

转录组应激反应是由消化时间和消化温度共同引起的

为了确定上述基因表达改变引起是由于消化的时间要求完成时间越长胶原酶分离或由于酶本身,我们进行了一次实验,对乳腺癌PDX组织用胶原酶或冷蛋白酶孵育3h。细胞悬浮至上清液中的取样时间为在30 分钟、1 h、 2 h、3 h。

4 阐明了消化时间和消化方法对转录组应答的影响。

4a  按照消化温度进行着色,显示消化时间对核心基因集中基因的平均归一化表达的影响。胶原酶的消化导致基因集在所有时间点上调,一个子集显示出了随着消化时间的增加其表达水平随之上调。4b 根据每百万的log计数,2小时与30分钟胶原酶消化的logFC变化。

分析:

(1) 通过检测上述核心基因组的基因,我们发现在所有的消化时间内,胶原酶和冷蛋白酶消化之间的核心基因组均显著上调 (4a)。这表明,消化酶(胶原酶和冷蛋白酶)的选择对细胞的转录反应有影响, 而与消化时间长短无关。然而,在胶原酶消化下,随着消化时间的增加,核心基因集的一个子集的表达量随之上调 (4a)(2) 为了量化这一点,我们进行了几个转录组范围内的两两差异表达分析,以辨别消化条件对转录组反应的影响。首先,我们比较了仅使用胶原酶30分钟和2小时的消化时间  (4b)。在进行差异表达分析的18734个基因中,有8064个(43%)存在显著差异表达(< 5% FDR),其中4917个基因在2小时内上调, 3147个基因下调。核心解离相关基因组的512个基因中,420个(82%)有显著差异表达(376个上调,44 个下调)。(3) 相比之下,重复使用冷蛋白酶消化细胞的分析,只发现两个消化时间点之间差异表达的基因要少得多(16,340个中的2500个,15.3%),而核心基因组的35.9%(上调70个,下调114个)随着时间的推移表现出差异表达。
4c 根据每百万的log计数,在30分钟的消化时间点胶原酶与冷蛋白酶的比值。c对数倍变化是每百万对数的函数。4d 根据每百万的log计数,在2h的消化时间点胶原酶与冷蛋白酶的比值。4e    胶原酶2h和30分钟消化时间点的比值,与胶原酶和冷的蛋白酶在2h的消化时间点的比值,这两者的倍数变化图示。图像显示受到影响的基因的大量重叠(ρ= 0.8)。

分析:

(1) 我们在30分钟比较胶原酶和冷蛋白酶消化的影响(图4c)。在进行差异表达分析的18242个基因中,有5039个(27.6%)存在显著差异表达(< 5% FDR),其中2173个基因在2 h时上调,2866个基因下调。在核心胶原酶相关基因组的512个基因中,306个(59.8%)有显著差异表达(223个上调,83个下调)。(2) 对比胶原酶与冷蛋白酶消化2小时的影响时(图4d),我们发现17345个基因(45.5%)中有7887个差异表达(4207个上调,3680个下调),核心基因集的512个(83.8%)基因中有429个差异表达(362个上调,67个下调)。(3) 这些结果有力地证明了消化时间和消化方法都促进单个癌细胞的转录组应激反应的发生。(4) 有趣的是,一组高度相似的基因同时受到消化时间和消化方法的影响。胶原酶2h和30分钟消化时间点的比值和与胶原酶和冷的蛋白酶在2h的消化时间点的比值与上述基因存在很强的相关性(图4 c)。(5) 这些结果表明,在单细胞转录组实验中,细胞对消化的反应集中在一组共同的通路上。

05

胶原酶解法在乳腺和卵巢组织中的保守应激反应

5 胶原酶解法在乳腺和卵巢组织中的保守应激反应。

5a 卵巢癌患者(上)和乳腺癌患者(下)的组织学样本,显示了肿瘤微环境的构成。5b  流式细胞仪(FACS)分析在37°C条件下胶原酶或6°C条件下冷激活蛋白酶消化分离的卵巢肿瘤组织,使用肿瘤细胞(EpCAM)、内皮细胞(CD31)、成纤维细胞(FAP)、淋巴细胞(CD45)、b细胞(CD19)、NK细胞(CD56)和T细胞(CD8、CD3)的标记物染色。

分析:

(1) 在获得胶原酶分离PDX样品时诱导表达的应激和热休克基因核心基因集后,我们接下来检测了分离方法对乳腺和卵巢患者样品中肿瘤微环境组成细胞的重新获得和转录组的影响。组织学和流式细胞仪分析显示了一个复杂多变的肿瘤微环境(5a, b)(2) 使用冷蛋白酶进行消化分离的卵巢癌组织样本中,增加了包括T细胞、细胞毒性T细胞和NK细胞在 内的淋巴细胞的获得 (5b,图S6)
表S1
表S2表S3


5c  根据已知每种细胞类型的基因标记,对卵巢癌(n = 2)和乳腺癌(n = 3)患者组织进行细胞类型分类的联合单细胞RNA测序实验的UMAP分析。

分析:

(1) 我们使用37℃的胶原酶或6℃的冷蛋白酶分离2个高级别浆液性卵巢(HGSC)和3个乳腺癌样本 (S1),进行单细胞RNA测序。获得的总细胞产量变化很大,从282个到9640个不等。(2) 随后,假定有一组细胞类型的公共标记基因 (S2、表S3),使用CellAssign将细胞分为一系列肿瘤微环境中的各种细胞类型。(3) UMAP分析单细胞RNA测序数据 (5 c)。根据流式细胞仪分析显示了广泛的细胞类型:包括上皮细胞、结构类型的细胞(内皮和成肌纤维细胞)、免疫细胞(B细胞、T细胞、单核细胞/巨噬细胞、浆细胞)(5 B)(4) 虽然在6°C分离的卵巢样本中,某些淋巴细胞群体的捕获明显增强,但从组织学分析和分离方法中 可以看出(S6),患者之间的整体微环境组成差异很大(5a);在所有的样品中,没有观察到细胞类型   在不同细胞状态下的相同的减少或增加。
5d来自图3的基因组的前40个基因在乳腺和卵巢患者样本的每种细胞类型中均有表达。点周围的黑色圆圈表示5% FDR时的显著性。5e通路分析不同细胞类型的MSigDB标记基因组的差异表达结果

分析:

为了研究在PDX模型中发现的由37°C胶原酶解而产生的转录反应在原发肿瘤样本中是否保守,我们接下 来对每种细胞类型的解离方法分别进行差异表达分析 (5d)
S7在PDX样本中发现中在每个原发肿瘤细胞类型表达上调的基因占核心基因集的百分比。S8   在PDX中消化方法相关的512个基因核心基因中,每个原发肿瘤细胞类型中显著上调的基因所占的百分比(FDR < 5%)。

分析:

我们发现,在PDX样品的核心胶原酶相关基因集鉴定的512个基因中,有大量一致表达上调的基因,其中61.7%~78.1%的上调基因是跨细胞类型的,有8.6%~54.9%的基因出现显著上调 (S4,图S7S8)
S9   与给定细胞类型的原发性肿瘤相比,PDX中消化方法(37°C胶原酶与6°C冷蛋白酶)引起的log倍数变化与Spearman的相关性分析图示。

分析:

(1) 虽然消化方法法对细胞类型的特异性基因表达的影响是非常明显的(图S9),但是每种细胞类型的差 异表达基因的整体途径分析结果显示,NFKB信号通路、凋亡和炎症通路中保守表达上调的基因在所有细胞类型中是上调的基因中最多的(图5e)。(2) 观察到的较小的细胞类型特异性效应包括:乳腺上皮细胞突起和尖端表面通路的增加,细胞毒性T细胞和肌成纤维细胞中活性氧的种类通路的增加 (图5e)。(3) 综上所述,这些发现表明所有的细胞类型对胶原酶的解离都表现出一定程度的应激反应,其中一些细胞类型表现出因细胞类型不同而出现的特异性反应。


讨论

(1)单细胞测序技术的出现为研究包括组织微环境和肿瘤异质性在内的复杂生物系统,以及发现其他难以检测到的新型细胞类型提供了可行的方法。目前的测序技术需要单细胞悬浮液通过微流体或微细胞平台,而从固体组织中产生单细胞悬浮液,这需要酶和机械破坏细胞外基质和细胞-细胞接触。迄今为止,这些解离方法对单细胞转录组的影响在很大程度上被忽视,尽管对单细胞RNA测序数据的解释有潜在的影响。此外,在组织的分离和通过射流装置的过程中,细胞会经历应力、剪切、氧化和凋亡等过程。因此,必须在样品处理和生物信息学两方面作出努力,以确保最小的噪音和最佳的数据过滤。

(2)在此,我们试图描述与组织分离和死亡或垂死细胞群相关的、人为因素造成基因表达。通过使用一个大型的、多样化的数据集,我们强调了关键质控指标的可变性,包括线粒体基因的百分比、UMIs  的数量和检测到的基因数量。我们确定了表达高或低线粒体基因的死亡细胞亚群,这与认为死亡细胞可以仅通过其线粒体基因含量来鉴定的观点相反。

(3)重要的是,根据PI/annexin V染色将FACS分为活细胞、死亡细胞或死亡细胞的三个集群都存在, 这表明细胞的转录组状态不一定与表面标记物状态相同(尽管两者是相关的)。如前所述,这让人联想到“伪时间”排序,从图2a中可以看出,随着PC1值的增加,通过PC1追踪转录健康细胞到转录死亡细胞的  数据,其过程近似地沿着轨迹移动。虽然表达的转录组与活的、健康的细胞相似,但线粒体含量低的死  细胞表达的MHC I类基因水平明显增高。MHC  I类基因参与抗原递呈T细胞,但也在多种细胞类型中表达,在应激刺激下诱导表达,并含有热休克诱导元件。除了排除线粒体含量高的细胞的标准做法外,这些MHC I类基因诱导的细胞也可谨慎考虑。此外,在单细胞研究中对应激通路表达的解释,包括表面免疫识别的组成部分,如MHC I类,可能尤其令人困惑。

(4)我们确定一个守恒胶原酶相关的转录模式,包括:应激的压力和热休克基因,在使用冷激活蛋白  酶分离样本时可以使上述影响最小化。我们证明了消化时间和胶原酶都参与了单个癌细胞的转录组应激反应。因此,冷蛋白酶所需的较短的孵育时间以及在低温下解离所捕获的相对稳定的转录组表明,这是替代胶原酶解离用于肿瘤组织单细胞RNA测序实验的一种潜在选择。我们建议,在进行大规模单细胞 RNA测序实验之前,应该评估每个组织和解离方法的解离诱导特征。

(5)作为样品制备方法的结果,上述已鉴定的基因集的转录可能由于其他手段而掩盖了它们的诱导。  此外,尽管与胶原酶相关的核心基因集不那么明显,但在解离过程中观察到细胞类型特异性效应,包括:乳腺上皮细胞突起和尖端表面通路的增加,细胞毒性T细胞和肌成纤维细胞中活性氧的种类通路的增加。

综上所述,这些发现表明所有的细胞类型对胶原酶的解离都表现出一定程度的应激反应,其中一些细胞类型表现出细胞类型特异性反应。这些可能会对单细胞RNA测序数据解释产生重大影响的应激反应,在低温下通过解离使其最小化。


相关阅读

单细胞测序文献精读03|PD-1阻断后肿瘤特异性T细胞的克隆替换(视频)
单细胞测序文献精读02|单细胞测序描绘三阴性乳腺癌的耐药性演变(视频)
套路必读:烧钱做单细胞上顶级期刊有哪些潜规则|单细胞专题
单细胞数据预处理原理问题集锦|单细胞专题
联川线上单细胞培训课程答疑合集|单细胞专题

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存