Cell子刊 | 植物单细胞转录组综述·植物功能基因组学的高分辨率研究方法

生信宝典 2022-03-28

The following article is from 琪先生 Author 小琪

▼ 植物单细胞转录组测序综述

Single-Cell Transcriptomics: A High-Resolution Avenue for Plant Functional Genomics

发表期刊：Trends in Plant Science

发表日期：2019年11月25日

影响因子：14.006

植物单细胞转录组

植物组织由一系列不同类型的细胞组成，通过细胞功能来区分细胞的类型。不同类型细胞协同作用，决定了植物组织的功能和可塑性。

要了解植物的发育和对环境变化的适应性，了解组织中细胞类型的不同功能是至关重要的。

单细胞RNA测序技术使我们现在能够捕获每种细胞类型的转录图谱，以描述其身份和功能的遗传基础。这种细胞类型定义基因网络的认识，对基础科学、提高作物对气候和其他环境胁迫的恢复能力都很重要

植物功能都是单细胞在不同组织中协同作用的结果。随着 RNA-seq 技术和组织处理技术的进步，现在我们已经能够捕获在单个细胞分辨率下的转录水平变化。

单细胞 RNA-seq 令人难以置信的潜力在于其研究和开发复杂组织中基于单细胞行为的调控过程。重要的是，这项技术能够分析任何植物的任何组织。虽然在处理和分析复杂数据方面仍存在一些挑战，但这项技术能得到前所未有的组织功能的详细信息，并能通过绘制植物细胞图谱中的细胞功能和相互作用来促进这些信息的应用，机会难得。

从单细胞分析中获得的启示

复杂器官和生物体的功能性是不同细胞类型及其特定功能协同作用的结果。要完全理解和识别复杂组织中最关键的细胞生物学进程，就需要在细胞类型甚至单个细胞水平上捕捉其发生的变化。以往在特定细胞类型的转录组学进展，是朝着这个方向迈出的至关重要的第一步，有助于揭示参与植物发育和胁迫适应的基本细胞活动。

复杂组织解离成单个细胞

基于微流体单细胞 RNA-seq (scRNA-seq) 方法的最新进展，我们现在有了研究任何特定生物体中细胞分辨率下转录变化的宝贵机会。

Hemberg-lab单细胞转录组数据分析（二）- 实验平台

在以动物为基础的研究中，scRNA-seq 对细胞研究产生了革命性的影响。除了有助于发现新的细胞类型，scRNA-seq 还有助于研究细胞中基因网络调控的随机原理，以及细胞命运选择和器官功能背后的转录组变化轨迹。

scRNA-seq 作为一种新测序技术，目前大多数都只是应用在动物/人体组织上，而其在植物科学领域各个方面的真正潜力，才刚刚开始被认识到。

在这里，我们更加强调开展植物 scRNA-seq 相关的机遇和挑战。

由于 Drop-seq 和 10x Genomics 已经在植物领域研究中成功开展应用，这篇综述阐述主要聚焦这两个基于液滴原理的实验平台。不过下面介绍的方法也适用于其他基于液滴原理的平台。

重要的是，下面单就植物研究介绍 scRNA-seq 方法的技术原理，解释 scRNA-seq 系统是如何运作的，并概述包括 scRNA-seq 测序数据基本统计分析在内的标准分析工作流程。

分析特定细胞信号网络的常用方法

在基于液滴的 scRNA-seq 方法被发明以前，单细胞分析依赖于使用激光显微切割或流式细胞荧光分选技术（FACS）来原位解离单个细胞。激光显微切割的缺点是通量低，通常只能捕获4-40个细胞，并且技术上也有相当的难度。

Genome Biol. 2015; 16: 9

Genomics Data. 2014; 2: 242-245

基于流式细胞术的方法，通过荧光标记来分离特定的细胞群，促进了我们对细胞类型或组织水平上的基因网络的理解。

2003年，Birnbaum K 将 FACS 与基因芯片相结合，绘制了拟南芥根组织的第一个基因表达图谱，包括 5 种细胞类型和 3 个发育区。连同随后的高分辨率研究一起，揭示了每种细胞类型的特定转录特征。类似地，进一步研究细胞对盐胁迫、缺铁、缺氮、pH值变化和特异性免疫的反应，均发现不同类型细胞的应激基因网络被激活。

http://refhub.elsevier.com/S1360-1385(19)30272-9/sref2

虽然流式细胞仪提供了根组织结构研究的重要发现。但对荧光标记系的依赖，又限制了对模式植物（主要是拟南芥）中已知细胞类型谱系的研究。

2015年5月21日的 Cell 杂志上，同期刊登了两篇利用微流体液滴技术和条形码（barcode）技术的文章，对数千个单细胞进行转录组分析，实现了单细胞转录组的并行高通量测序。

https://www.sciencedirect.com/science/article/pii/S0092867415005000
http://refhub.elsevier.com/S1360-1385(19)30272-9/sref26

Klein A.M.

Cell. 2015

Macosko E.

Cell. 2015

Junker JP.

Mol Cell. 2015

自此，单细胞转录组学进入大规模“生产”时代

这种开创性的新方法已经转变了哺乳动物研究中的单细胞分析方式，并也开始在植物中逐渐实施。

目前植物单细胞转录组测序已发表的研究

对于单细胞技术应用于植物研究来说，处理有细胞壁的组织通常会导致捕获效率严重降低，这一直是个困难和挑战。

目前基于液滴原理的单细胞测序方法，转录组的分辨率相对较低 (∼10,000 reads/cell)，因此，从单细胞分析中获得的表达信息来源可能仅限于那些高表达的基因。

最新的 10x Genomics 单细胞技术平台结合高效的组织裂解方案，提高了细胞捕获和基因检测的效率。在无需考虑组织特性的情况下，从而提高了单细胞分析的解析度。（10X单细胞测序分析软件:Cell ranger，从拆库到定量）

包括 inDrop、Drop-seq 和 10x Genomics 单细胞技术在内，基于液滴的各种单细胞测序方法都运用了相同的技术原理，即其中利用微流体技术将单个细胞和条形码封装到体积在亚纳升级的液滴当中，细胞裂解和条形码标记都发生在这液滴空间中。

一般来说，inDrop 和 10x Genomics 的捕获效率更高。这对于可获得的组织比较少的实验来说是一个理想的方法。

另外，10x Genomics 的灵敏度最高，这使其成为检测低表达转录本的首选方法。Drop-seq 是最经济有效的实验方案，但是细胞捕获效率和灵敏度相对较低。

不同单细胞实验平台的主要性能参数

不同的技术在细胞捕获效率、doublet 比例，以及费用方面有所不同。所开展实验的具体场景，决定了哪种单细胞实验平台更加合适。

Zhang X. Mol. Cell. 2018

仅凭经验来讲的话，

10x Genomics 目前仍是大多数用户稳妥的选择；

当样本数量较多时，Drop-seq 非常具有性价比；

当选择低丰度转录本，或者需要个性化实验流程时，inDrop 则成了一种较好的选择；

这三种平台都能提供令人满意的转录组检测效率，而且效率越高，实验成本越高。

以下总结了使用 scRNA-seq 的主要注意事项

衡量 scRNA-seq —— 费用和产出的平衡

细

胞

数

量

单个样本中，要测到多少个细胞才行？

单细胞转录组中单个样本的细胞数量，通常在1000 - 8000个细胞范围内。达到这个细胞数量所需要的组织样本量多少，取决于所选用哪种实验平台。当决定单个样本中所需检测的细胞数量时，应该考虑到研究中最稀少细胞类型的预期频率，但也要考虑到在单个细胞中无法检测到太多基因。每种细胞类型能捕获到更多的细胞数量的话，将有助于提升研究的深度。

如果预期要捕获的细胞数量远小于1000个的话，建议考虑采用 SMART-seq2 方法。

回

收

细

胞

数

量

回收细胞数量，如何影响下游数据分析？

细胞数量将影响下游分析的解析度（resolution）；也就是说，细胞数量不足意味着drop-out对细胞整体的影响变得更加严重，可能将更难检测到marker基因 / 差异表达基因，罕见的细胞也将被错过而无法发现。

谨慎选择符合实验要求的单细胞平台有助于降低这个问题发生的概率。

测

序

深

度

测序深度如何影响下游分析的灵敏度？

单细胞分析所需的测序深度取决于实验平台和实验设计。10x Genomics 建议每个细胞至少有2万条 paired-reads 。测序饱和度（sequencing saturation）用来判定一个数据的测序深度是否已经足够。

饱和度合适与否取决于实验设计。如果目的是检测低表达的转录本，则需要测序饱和度 >90% 。如果目的仅仅是描述细胞类型，则较低的测序饱和度也是可以接受的。

权

衡

细胞数量与测序深度之间如何权衡？

基于上述考虑，由实验设计和问题来衡量是应该优先考虑细胞数量，还是优先考虑测序深度。

除了基于液滴的方法以外，还有基于微孔的 scRNA-seq 方法，比如 SMART-seq2 。SMART-seq2 实验流程要求细胞被用分选（一般用FACS 技术）到一块平板上的单个小孔中，这样每个细胞被处理好后，可以单独进行测序。

SMART-seq2 的优点是捕获效率明显提高，能够进行全长转录组测序，以及以捕获更少细胞为代价降低技术噪音（实验人员能处理的平板数量有限）。

Hemberg-lab单细胞转录组数据分析（七）- 导入10X和SmartSeq2数据Tabula Muris

在所有 scRNA-seq 方法中，Smart-seq2 的灵敏度最高，远超 10x Genomics 平台，这使其成为检测低表达转录本的最佳选择。此外，SMART-seq2 和 FACS 结合更有利于研究罕见组织，Efroni 在 2016 年报道了他们关于根分生组织再生的研究。

http://refhub.elsevier.com/S1360-1385(19)30272-9/sref28

与基于液滴的方法一样，基于微孔的 scRNA-seq 并没有在植物群落中得到广泛应用，但却特别适合在组织产量较低的小器官或罕见组织上进行实验。

scRNA-seq 在植物上的应用

对于植物研究来说，单细胞实验在收集有代表性（无差别的）细胞池之前，需要通过酶除去细胞壁（得到原生质体）。细胞壁组成（取决于木质化或木栓化程度）和细胞层在组织中的位置的差异，可能导致细胞不能完全解离。如果在消化过程中不能加以适当地处理，则会导致细胞收集的偏差。

此外，对于加入到单细胞系统的原生质体，必须要谨慎考虑悬浮缓冲液的属性：

粘度和结晶的可能性；
相容性，如含Ca2+的细胞悬浮缓冲液会导致 Drop-seq 裂解缓冲液有沉淀；
在不引起转录组水平改变的情况下，能维持细胞活性的渗透压 —— 如乳糖具有类似于蔗糖的渗透特性，但蔗糖能够被植物细胞所感知，并调控与能量相关的信号传递过程的转录。

一旦在悬浮液中捕获了目标细胞，这些细胞就被加载到基于液滴的 scRNA-seq 仪器上，以便使用带条形码的珠子进行标记。

利用被 DNA 探针包裹的磁珠捕获 mRNA 分子

Drop-seq 实验流程是将单个细胞封装在液滴中，并利用附着在微珠的独特引物条形码系统来识别细胞来源和独特分子标识符 (UMI) 识别每个转录本。使用UMI可以确保单独标记每个mRNA转录物，并识别 PCR duplicates。微珠-引物-mRNA 复合物被称为附着于微粒的单细胞转录组(single-cell transcriptomes attached to microparticles，STAMPs)，即被捕获到的转录本。

在微流体设备中，水流中包含悬浮状态下的细胞。裂解缓冲液中包含了用条形码标记的微珠。这两股流体汇集在一起后穿过油体通道，最终形成一个个小液滴。

单个细胞用条形码珠和溶解缓冲液包裹在液滴中

一旦液滴包裹成功，细胞立即被裂解，释放出与微珠表面引物结合的 RNA，在珠表面反转录成 cDNA，生成包含成千上万个单细胞条形码的 cDNA 文库。(Hemberg-lab单细胞转录组数据分析（四）- 文库拆分和细胞鉴定)

测序后，这些文库被量化为一个数字型基因表达矩阵—每个基因和每个细胞条形码的read counts 。

数字基因表达矩阵形式的原始数据

一般来说，液滴的数量远远多于样本中细胞的数量，因此大多数条形码都来自于不含有细胞 (空 barcode) 或含有单个细胞的液滴。然而，解离不完全的组织原生质体会产生含有两个或更多细胞的液滴 (doublet) 。识别空 barcode 和 doublet 是数据分析过程中的主要挑战。关键的第一步是定义空 barcode 和非空 barcode 之间的阈cut-off 值。为了估算这个 cut-off 值，推荐两个诊断曲线：累积分布曲线和 barcodes rank 曲线。这两个曲线图的目的是根据 reads 数目的分布来确定 cut-off 值。(单细胞预测Doublets软件包汇总-过渡态细胞是真的吗？)

首先，按降序排列的每个细胞条形码的累计 read 数量的累积分布图，应该呈现一个“膝盖式”分布，表示从附着于微粒的单细胞转录组（STAMP）到背景噪声的过渡。(Hemberg-lab单细胞转录组数据分析（九）- Scater包单细胞过滤)

10x Genomics 中较常见的累积分布曲线

对于 barcodes rank 图，将细胞barcode 按照read count总数由高到低进行排序，然后将排好序的barcode和经过对数转换的read count绘制于坐标轴上。这将呈现一个反S形曲线，其中曲线下落处表示附着于微粒的单细胞转录组（STAMP）和背景的间隔。

虽然这些图支持决定将哪些细胞纳入下游数据分析，但它们的质量以及如何解释则取决于所用的仪器、测序深度以及组织类型。

10x Genomics 中较常见的 barcodes rank 曲线

因此 barcodes rank 或累积分布曲线不理想，并不是一定意味单细胞测序实验运行失败。在极端情况下，建议进一步查看数据特征（如基因数量和UMI数量），以便更深入地了解数据质量究竟如何。

下一步要进一步消除技术和生物学上的变量，包括空 barcode、doublets 和破碎细胞（低质量细胞）。可视化查看基因和 UMI 的数量分布以及线粒体RNA和plastid RNA在细胞中百分比的分布图，以确定筛选到合适的阈值。

通过基因数量、UMI数量和线粒体 read 比例的阈值过滤细胞 barcode

图中离群的异常点代表破碎细胞和 doublets 。其中，那些 UMI 和检测到的基因数量都较少，同时线粒体基因 reads 占比又大 (>10%) 的细胞，可能是由于细胞破碎造成的细胞质 RNA（cytoplasmic RNA）流失。线粒体比单个转录本分子要大得多，在破碎的细胞膜中不易流失，导致线粒体基因在单细胞测序数据中被异常富集，占比异常升高。凡是有以上特征的细胞都可能已经是破碎细胞，应该在下游数据分析环节中将其过滤去除。

空 barcodes 和破碎细胞含有的遗传物质较少；
doublets 能检测到更多的基因和 UMI，因此其含有的遗传物质又比正常单细胞要多。
Hemberg-lab单细胞转录组数据分析（十）- Scater基因评估和过滤

总之，建议根据数据的分布情况，使用较为严格的阈值过滤那些表现异常值的细胞。近期还发表了一些更加复杂的 doublets 识别方法，如 Scrublet 和 doublet Finder 。

http://refhub.elsevier.com/S1360-1385(19)30272-9/sref34
http://refhub.elsevier.com/S1360-1385(19)30272-9/sref35

Scrublet

DoubletFinder

目前最好的做法是起初采用宽松的质控阈值，如果下游数据分析中出现明显污染，比如这些质控中的一个指标导致了细胞集群发生差异改变，再考虑重新调整质控阈值。

采用降维和聚类方法鉴别细胞类型

获取可靠和高质量的细胞测序数据之后，分析这些数据所涵盖的生物学特征。目前，已发表的植物 scRNA-seq 数据都是采用 10x Genomics 或 Drop-seq平台而开展根组织的研究。由许多不同细胞类型组成的复杂结构，使根组织成为单细胞转录组研究植物理想的样本材料。

目前所有的植物根组织 scRNA-seq 研究都使用相似的数据分析流程，比如用 Seurat 和 Monocle 进行数据处理和逐步分析。

简单地说，采用变异度最高的那些基因数据进行主成分分析(principal component analysis，PCA) 和 t 分布随机邻域嵌入( t-distributed Stochastic Neighbourhood Embedding，tSNE) ，或者均匀流形近似和投影 (Uniform Manifold Approximation and Projection，UMAP) 使数据结构可视化。目前，tSNE 和 UMAP 等可视化方法已经被开发出来，对如 scRNA-seq 的 read count这样复杂的高维数据进行分析和可视化。

scRNA-seq 数据分析仅利用那些基于平均表达值和离散度而言，变异度最高的基因，用以区分特定细胞类别的表达模式。

高变异基因（HVG）的特征就在一些细胞中高表达，而在另一些细胞中低表达，这些高变异基因很可能这就是细胞亚群之间形成差异的驱动因素。

通常，高变基因的最佳数量在1000-5000个之间，这取决于数据的复杂度。实现高变基因排列的程序（如Seurat和Scanpy）都包含了可视化工具，以便引导用户定义正确的阈值。如果已知重要基因，Luecken和Theis 等人建议尝试改变阈值，以确保所有这些重要的基因都能作为高变异基因进入下游分析。

http://refhub.elsevier.com/S1360-1385(19)30272-9/sref33

利用 tSNE 或 UMAP 对数据进行可视化处理。每个点对应一个细胞

转录组相似细胞的位置，彼此接近。颜色对应于群集的特性。

在使用 tSNE 或 UMAP 进行可视化和聚类算法识别具有相似转录特征的细胞亚群之前，PCA能够将数据集的复杂度降低到更少的维度。tSNE 或 UMAP 展现数据集的高维度，并以保留底层结构的二维形式加以运算。在 tSNE 或 UMAP 图中，转录组相似的细胞通常是相邻很近的。 k-means 或基于图像（graph-based ）方法的聚类算法被用于识别生物学显著的组别，通常对应于不同的细胞类型。

通过在 tSNE 或 UMAP 图上给细胞标记不同颜色用来展现出不同的细胞集群，以此能作为聚类质量的指标：如果集群轮廓分明，并且颜色标识与空间排布相匹配，则集群很可能体现出内在的生物学特性。

参数的选择对于 tSNE和UMAP 有较大影响，特别是 tSNE 的混乱度参数（ perplexity parameter）。这些参数需要针对每个数据集进行优化。将这些数据降维和聚类后，能在生物学表达模式研究的基础上更好地帮助理解数据结构。(单细胞分群后，怎么找到Marker基因定义每一类群？)

http://refhub.elsevier.com/S1360-1385(19)30272-9/sref40

降维和聚类还可以帮助鉴别那些经常被认为属于不同细胞类型的相似细胞群。在分析过程中，需要对许多参数进行设定。每个数据集都有最适合的参数，更改某个参数会影响另一个参数的最佳选择。这导致数据经常被反复分析—调整不同的参数设置，直到确定最佳选择为止。

分析工作流程中关键的决策点

有 2 种方法被广泛应用在细胞集群类型识别中：

在监督条件下，检测那些已知细胞类型标志物的表达；

在非监督条件下，识别每个聚类中特异表达的基因。

Denyer T. Dev. Cell. 2019;

Shulse C.N. Cell Rep. 2019;

有监督分类方法是通过已知细胞和组织类型表达谱的综合数据库实施的。细胞识别指标方法使用的信息标记组合是从以往研究中基于适当的方法挑选得来，而并非依赖于变异基因和相似的表达模式，无需选择那些在单个细胞类型中才特定表达的基因。

根据细胞标识指数 (ICI) 指定单个细胞所属的细胞类型

Efroni I.et al. Genome Biol. 2015

利用 Spearman’s rank的相关性的监督方法，能够通过比较簇内的基因表达与现有的Marker来识别不同的细胞类型。

Jean-Baptiste K. Plant Cell. 2019

Denyer等人进一步使用非监督细胞聚类来识别潜在的新型细胞类型标记，并通过与现有植物表达图谱中的表达进行比较，然后在转录报告融合（transcriptional reporter fusions）的体内对这些标记进行了原位验证。

<< 向下滑动查看更多 >>

Den>yer T. Dev. Cell. 2019

在拟南芥根组织的研究结果表明，scRNA-seq 数据能够鉴别不同细胞类型，尤其是识别中柱鞘细胞、韧皮部筛管和不同表皮亚群，甚至连静止中心 (quiescent centre, QC) 这样非常小的细胞亚群，都能很容易地发现它们所对应的细胞集群。

在 Denyer T. Dev. Cell 中，利用 15 个 QC 相关基因的表达模式鉴定到 36 个被推定是 QC 的细胞

在 Ryu K.H. Plant Physiol 中，利用 52 个QC marker，却只识别到 2 个被认为或许是 QC 的细胞

上述研究结果表明，植物根组织的 scRNA-seq 可以作为研究罕见细胞类型基因网络的跳板，有助于增进我们对植物生命体最基本问题的理解，如在细胞命运决定过程中调控干细胞生态位功能的过程、根形态发育和根系寿命。然而，正是由于捕获到的这些细胞群体规模如此之小，所以在统计学严谨性方面，更加不能有半点马虎。

拟时序分析揭示发育结构

研究植物根细胞基因表达模式的一个好处，就是涵盖了从分生组织干细胞巢和未分化细胞，从伸长区的新分化细胞到根成熟区的完全分化细胞，不同类型细胞的调控模式。

“拟时序”的概念，可用于研究未分化分生组织细胞向成熟组织的发育过程。在这种分化进程中，不同发育阶段对应着细胞基因表达谱的不同变化。然而，细胞的转变可能表现出不同的速率。这种不同步性，就意味着不应随着时间来评估基因表达的变化，而是应该依赖于发育过程中的进展。

拟时序是捕获上述发育进程的一种抽象方法。拟时序方法利用机器学习来让细胞沿着“时间”轨迹排列，这种方法有助于更深入地了解不同发育阶段和细胞转变。

2019 年 Denyer T. 在 Development Cell 期刊上首次采用拟时序分析从根分生组织到成熟组织的分化进程。在研究中，研究者将一些细胞集群定义作“分生”组织。这表明，尽管细胞命运在某一次关键的分裂之后就已经注定，但这些早期细胞的转录特征，比起其所属于的细胞类型，似乎更取决于其所在的发育阶段。

拟时序分析还能破解涉及细胞分化过程中基因的调控网络，如非毛状细胞、毛丝体（根毛细胞）、皮质分化。

Denyer T. Dev. Cell. 2019

scRNA-seq 在植物科学中的应用前景

在本质上，一个组织的功能在于组成其细胞类型的特定功能。在动物系统中，scRNA-seq 不仅能够检测到复杂组织中单个细胞的类别，而且还能够识别新的细胞类型和细胞类型的状态。这使我们对复杂组织中的基因表达动态，以及组织在不同生理条件下（健康组织与病变/癌变组织）的变化有了全新的认识。

Cao J. Nature. 2019

Tikhonova A.N. Nature. 2019

随着单细胞技术发展，不断出现能够研究更加复杂的基因调控原理的生物信息学方法。对 scRNA-seq 研究的这种热爱，为旨在给每个细胞类型建立“身份信息”，以及探索形成组织的不同类型细胞所在空间位置的人类细胞图谱计划 (Human Cell Atlas Project) 发展铺平了道路。

如上所述，最近的研究已经证明了将 scRNA-seq 应用于植物系统的可行性，以及在动物身上进行相似规模项目的可行性。将聚类和拟时序分析方法相结合，scRNA-seq 测序数据定义的基因网络可以识别与及根细胞谱系分化有关的特定细胞类型基因表达，进而描述整个组织的发育轨迹。

除了解决发育时间轴以外，不同类型细胞可能会影响彼此生成根体的细胞状态。对内皮层、毛状细胞和毛丝体这样缺乏明确细胞谱系界定的拟南芥突变体 scRNA-seq 研究表明，单个细胞转录水平的变化是由于不同细胞类型集群整体改变所导致的。

细胞类型可能进一步影响彼此生成根体的状态。scRNA-seq对缺乏明确细胞系的拟南芥突变体(如内胚层、成毛细胞或成纤维细胞)的研究显示，单细胞转录组发生了改变，这与细胞类型簇的整体模式变化有关。检测单个细胞的转录水平变化的 scRNA-seq 技术，表明其已经成为一种解释突变体、植物种质和自然植物种群表型的新方法。

除了像全根这样大块组织，高通量 scRNA-seq 还能用来检测特定的组织部分或发育区，比如根尖上的根分生组织。与成熟的根不同，由于可用的荧光标记种类有限，FACS技术不太适合根尖组织研究。捕获一种类型细胞的特定状态，或者处理像QC细胞那样在组织中只占很小比例的细胞类型也会变得十分困难。

基于液滴方法的 scRNA-seq 在检测基因通量较低和 drop-out 情况下，会出现识别罕见细胞群的困难。也就是说，如果一个marker的表达量很低的话，他在单细胞分析中被检测到的机率就会很低。

目前的单细胞测序方法，确实都能够捕获并识别QC细胞。这表明虽然在解决不同细胞状态方面， scRNA-seq 的灵敏度差异可能很微小；但这种灵敏度对于从干细胞（如出生表皮）到分生和成熟细胞（如毛状细胞）的渐进转型研究则是必不可少的。

需要注意的是，不同单细胞平台之间的细胞解离方法、文库构建引入的技术偏差，使整合不同实验项目下得到的单细胞测序数据仍是一个巨大的挑战。

目前，已经有多种不同的运算方法能将不同单细胞测序数据集进行整合。Seurat v3能够通过两个或多个独立的单细胞测序数据集中都存在的少部分属于同一细胞类型的数据点，对整个数据集进行“锚定”进而多数据整合。

scRNA-seq 能进而帮助我们理解植物多倍性（ploidy）的功能意义。随着根细胞的发育和成熟，将经历了一个几乎是植物所独有的过程：根细胞经历倍性变化。在这一过程中由核内复制（DNA复制脱离有丝分裂的一种细胞周期）开始，细胞的倍性随着细胞发育而逐渐增加。

Bhosale R. Plant Cell. 2018

植物暴露在极端和波动的环境条件下，通过增加细胞和基因组的稳定性的多倍性，能保持植物体在应激环境下的抗逆能力。

与此相一致的是，随着细胞增殖周期时相的变化，细胞应对逆境的能力也相应发生变化。有趣地是，一旦根干细胞开始分化，细胞就失去了再生的能力。特定细胞类型的基因芯片和 RNA-seq 研究都表明，细胞身份在应对环境胁迫时起着重要作用。对于研究不同增殖周期的不同细胞类型之间的应激反应差异来说，单细胞研究将尤其重要。

然而有研究却表明，当在热休克这样的较强处理方式时，由于胁迫对转录活动的影响及经典marker基因的下调，特定身份的细胞就很难指定到本应归属的集群中。在实验过程中，必须考虑到低表达的细胞类型标记基因被较强表达的应激基因网络所掩盖的这种情况，并在算法上加以校正。

Jean-Baptiste K. Plant Cell. 2019

未来将绘制植物细胞图谱 (Plant Cell Atlas)

通过增强时空分辨率，现在scRNA-seq 使我们几乎能够剖析整个生物体。但想要在单个细胞基因调控网络中获得更多的详细见解，仍需要在单细胞标签（single-cell tagging）、标记（ labelling）、mRNA捕获以及生物信息学方面加以更多改进，才能降低技术噪音的干扰。

随着技术的进一步发展，单细胞检测的范围和分辨率正在逐步提升。利用单细胞水平的 ATAC-seq 测序对转座酶易接近核染色质（transposase-accessible chromatin）进行分析，获得 scRNA-seq 转录模式下包含调控序列的DNA区域。将scRNA-seq数据与成像技术相结合，可以实现在组织中对细胞类型和细胞状态的时空重建。

关于这项技术，尤其是与细胞表观遗传学（比如基于 scATAC-seq）、多组学方法、高分辨率成像，以及时空分辨细胞工程相结合的时候，可以用来展示在变化环境下复杂组织的发育和行为中“微过程”之间的协同作用。

植物细胞图谱 (plant cell atlas) 的建立，将为深入了解细胞间的相互作用是如何影响细胞功能、细胞如何在复杂的系统中发育成器官，以及细胞如何作为一个网络对病原体或环境变化作出反应等问题奠定全新的基础。

除了促进基础研究之外，全面的植物细胞图谱将成为基础研究的基本框架，旨在持续提高农业生态系统的生产力和价值。

Rhee S.Y. Trends Plant Sci. 2019

有关植物单细胞转录组学研究的问题

仍未完，待续ing........

▼我们距离用植物单细胞转录组拼装成复杂组织的目标，还有多远？

▼scRNA-seq 的哪些参数，仍是获得深度转录组数据的限制因素？

▼我们能将 scRNA-seq 技术应用于任何植物组织和作物吗？

▼如何以干细胞生态位和单个细胞类型界定植物/根的横剖面线图？

▼哪些基因网络能够界定和维持静止中心细胞和干细胞，以及二者相互作用？

▼如何界定干细胞最初阶段细胞类型的同一性？

▼由什么决定单个类型细胞的状态，以及受到邻近细胞多大程度的影响？

▼哪些信号和基因网络调控不同类型细胞的发育转变？

▼怎样界定单个细胞的类型，在发展或环境胁迫期间，它们的状态会变化到什么程度？

▼不同细胞类型以及细胞类型的状态是如何促进植物发育和适应胁迫环境的？

▼在不同的发育阶段和胁迫条件下，不同类型的细胞会普遍存在哪些转录和翻译以外的调控原理（如转录噪音）？

推荐阅读

学习津贴

单篇留言点赞数的第一位（点赞数至少为8）可获得我们赠送的在线基础课的9折优惠券。

越留言，越幸运。

主编会在每周选择一位最有深度的留言，评论者可获得我们赠送的任意一门在线课程的9折优惠券（偷偷告诉你，这个任意是由你选择哦）。

往期精品

画图三字经生信视频生信系列教程

心得体会 TCGA数据库 Linux Python

高通量分析免费在线画图测序历史超级增强子

生信学习视频 PPT EXCEL 文章写作 ggplot2

海哥组学可视化套路基因组浏览器

色彩搭配图形排版互作网络

自学生信 2019影响因子 GSEA 单细胞

后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集

如果你喜欢我这篇内容

请给我点个在看哟

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡

桐城一派｜倒在“跨年夜”的龚书记，13个字换来免职调查冤不冤？

比佟丽娅还恋爱脑，怀孕7次流产4次，目睹丈夫背叛却选择原谅

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…

Cell子刊 | 植物单细胞转录组综述·植物功能基因组学的高分辨率研究方法

学习津贴

往期精品

您可能也对以下帖子感兴趣

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突 认定该生系高空坠落死亡

桐城一派｜倒在“跨年夜”的龚书记，13个字换来免职调查冤不冤？

比佟丽娅还恋爱脑，怀孕7次流产4次，目睹丈夫背叛却选择原谅

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…

生成图片，分享到微信朋友圈

Cell子刊 | 植物单细胞转录组综述·植物功能基因组学的高分辨率研究方法

学习津贴

往期精品

您可能也对以下帖子感兴趣

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡