谁说植物单细胞测序一定要原生质体?no!抽核一样能做!|单细胞专题
近年来,高通量单细胞转录组测序技术在动物和人类研究中蓬勃发展。然而,在植物样本中鲜少有使用高通量平台(如10x基因组学或Drop-Seq])进行的大规模单细胞研究发表,并且研究结果中大多数是拟南芥根制备的原生质体。单细胞测序在植物组织中应用较少的一个主要原因是植物细胞被细胞壁包裹,需要制备成原生质体才能释放单个细胞。拟南芥根部制备原生质体的技术比较成熟,但在其他物种或组织中仍旧存在较大的技术难点。此外,考虑到植物组织的复杂性,从所有细胞中均一地产生原生质体同样具有挑战性。原生质体分离过程中的酶消化和随后的清除过程可能会对细胞造成胁迫从而影响转录组。
那么除了制备原生质体之外,就没有别的方法帮助植物进行单细胞测序了吗?这时候你可能会想,欸,动物除了酶解还能通过抽核做单细胞,那植物是否也可以呢?恭喜你!思路完全正确!今天和大家分享的这篇文章的作者就提出了一种无原生质体的方法,flsnRNA-seq,使用分离的核在植物的单核水平上进行大规模的全长RNA分析。
目前很多科研工作者确实将抽核技术应用在了植物上,具体的实验方案在作者之前的推文中也有详细的介绍。除了实验方法之外,植物组织用单细胞核测序技术得到的数据结果也已经有文章发表(点击蓝字即可回顾文章解读)。
发表杂志:genome biology
影响因子:13.583
发表时间:2021.2.3
文章作者在拟南芥的根(通过原生质体得到单细胞数据较丰富)和胚乳(较难制备原生质体)中分别测试对比了抽核与制备原生质体得到的单细胞测序数据结果。除了主要捕获丰富信息的标准Illumina短读文库外,长读测序最近也被纳入单细胞研究。为了获取植物细胞核中大量含有内含子的rna,文章作者还构建了一个基于nanopore的长阅读文库,并开发了一种名为snuupy的生物信息学方法来表征每个细胞核中的mRNA异构体。结果证明了长读测序的单核策略将使植物生物学家能够绕过原生质体,在单细胞水平上研究来自选择性剪接和选择性多腺苷酸(APA)的RNA异构体,并提供额外的转录组复杂性维度,这可能进一步改善不同细胞类型的聚集或特征。
具体的结果展示如下:
作者从10天大的拟南芥幼苗的匀浆根尖中直接分离细胞核后使用10x平台标记细胞核并获得全长cDNA文库,然后将其分成两个相等的部分,分别在Illumina进行短片段测序和Nanopore中进行长片段测序。
从Illumina文库中,总共获得了1186个单核转录组,覆盖18913个基因,中位数基因/核为810个,中位数UMIs/核为1131个。值得注意的是,含有内含子的mRNAs在植物细胞核中的比例非常高,为54%,而在总RNA中的比例不到2%。
从Illumina数据生成细胞基因丰度矩阵后,使用基于无偏图的聚类方法Louvain,确定了14个不同的细胞簇。接着应用最近对拟南芥根进行的大规模单细胞研究中提供的一组细胞类型特异性标记基因对每个簇进行注释。能够将细胞类型分配给所有14个簇,并确定了之前报告的10种主要根细胞类型,每个细胞类型的特征转录本在相应簇中富集。
与之前的报告一致,作者还注意到,得到的结果中的一些细胞类型由多个簇组成,如干细胞生态位(簇1、簇4和簇12)、成熟非毛发(簇2和簇6)和内皮层(簇5和簇8),显示了细胞类型中还有亚细胞类型。此外,作者发现内皮层的亚细胞类型标记基因在其相应的亚细胞类型中富集,证明了单核数据的稳健性。此外,作者使用Scanorama算法将得到的数据集与最近发布的几个来自原生质体的根单细胞数据集进行比较。来自flsn—RNA测序的单核数据集的表达丰度矩阵非常类似于从相同组织(10天幼苗,0.5 mm初生根尖)生成的基于原生质体的单细胞数据集。综上所述,作者证明了单个细胞核的转录组足以进行细胞类型鉴定,并且可以作为原生质体的可靠替代物
Sicelore搜索polyA序列和adapter 序列,并将两者之间的区域定义为潜在barcode和UMI。然而,该算法依赖于Nanopore BaseCall软件生成的polyA尾序列的识别,这往往严重低估了polyA尾的长度。作者试图通过开发一种与polyA无关的算法(命名为Snoupy)来进一步改进Sicelore,该算法在nanopore读取的未映射区域中搜索barcode和UMI。因此,与使用Sicelore相比,Snoupy从的nanopore数据中恢复了20%以上的reads。经过Snoupy处理后,从nanopore数据中获得了1169个长读单核转录组(与Illumina数据中的1186个相比)。nanopore数据中每个核的平均UMI计数(729)和每个核的平均基因计数(563)分别为Illumina计数的约64%和约70%,并且在所有核中高度一致。使用nanopore丰度矩阵的聚类结果与Illumina数据生成的结果非常相似,表明nanopore数据本身足以用于细胞类型分类,这与最近完全使用nanopore数据对人类和小鼠细胞进行的大规模单细胞分析相一致。
与Illumina文库相比,单核长读nanopore文库提供异构体水平的信息,如剪接和APA,而Illumina文库只捕获大量转录物信息。因此,作者生成了两个附加的异构体矩阵,分别跟踪单个核中的剪接和APA,并将它们与用于多层聚类的Illumina丰度矩阵相结合,以测试这些额外的信息层是否能改善细胞类型分类。
作者发现Illumina数据中的原始簇2(成熟非毛发)和簇10(皮质)在多层聚类后可进一步分离为两个亚细胞类型簇。例如,根据Illumina数据,AT3G19010的转录本存在于亚细胞类型2.1和2.2中。nanopore数据显示两个亚簇之间该基因的剪接水平存在很大差异,第二个内含子在亚细胞类型2.2中大部分未剪接. 值得注意的是,簇2.2中的前1个富集基因JAZ7可在茉莉酸盐反应期间调节剪接,这意味着细胞类型特异性剪接调控的迷人潜力,可通过flnsRNA-seq进行研究。
在开花植物中,种子发育是通过双重受精开始的,在此期间,卵细胞和中央细胞分别与精子细胞融合形成胚和胚乳。胚乳嵌入种皮中,负责从母本向发育中的胚胎提供营养。在拟南芥中胚乳,受精后形成的初级核在没有胞质分裂的情况下经历了几轮快速核分裂,产生了一个称为合胞体的多核细胞,后来细胞化并分化为三个胚乳结构域:珠孔、中央外周和合点。合胞体的细胞化对胚胎活力至关重要,当胚胎到达心脏阶段时,这个过程就开始了,从珠孔区域开始,以波浪状模式逐渐向中央外围进行,最终到达合点区。由于胚乳较难制备原生质体,因此尚未在单细胞水平上进行检测。
本文作者将flsnRNA-seq 应用于从拟南芥心脏期胚珠中分离的多核胚乳,并生成了 Illumina 和 Nanopore 10x 文库。从 Illumina 数据中获得了 576 个细胞核,中位基因/细胞核为 645,中位 UMIs/细胞核为 853。所有 576 个细胞核均被 Nanopore 文库捕获,中位基因/细胞核为 300,中位 UMIs/细胞核为362。基于 Illumina 丰度矩阵,作者使用 Louvain 方法确定了六个簇。
接下来,作者使用 Nanopore 全长转录本数据分析每个细胞核中保留的内含子,发现来自簇 4 的细胞核(占总细胞核的 14% 的主要簇)表现出明显高比例的不完全剪接转录本。先前的几项研究已经确定,内含子读数的增加是转录激活的指标,未剪接的前体和剪接的成熟转录本的比率已被广泛用于估计 RNA 速度。在这个特定的胚乳核簇中不完全剪接的转录本的高比例可能反映了延迟的前mRNA 衰变、破坏的内含子转换率或转录的全局激活。
接下来,作者使用先前报道的心脏阶段富含细胞类型的基因来分配每个细胞核的细胞类型,并发现簇 4 中的大多数细胞核被注释为珠孔胚乳。此外,对簇 4 中上调基因的基因本体论 (GO) 分析发现,所有富集的细胞成分术语都与膜相关,表明这些细胞核准备形成细胞膜并进入细胞化阶段,这与之前的观察结果一致,即拟南芥胚乳的细胞化首先在珠孔胚乳开始。
因此,作者的方法确定了一个独特的胚乳核簇,其中不完全剪接的转录本比例很高,进一步的研究可以确定这是由于转录增加还是剪接延迟。
通过上文的数据结果,作者很好地证明了无原生质体的大规模单核测序足以用于拟南芥的细胞类型分类和标记基因鉴定。与使用原生质体相比,在 10x Genomics 平台上使用分离的细胞核进行单细胞测序的每个细胞成本仍然相对较高,因为 10x Genomics 在细胞核上的捕获效率低于细胞,原因可能是细胞核的尺寸较小。绕开原生质体这一步骤将能够对广泛的组织和植物物种进行大规模单细胞分析。但是抽核也并不是万能的,从某些细胞类型中分离细胞核仍然具有挑战性,需要进一步优化细胞核分离方法。本文作者独特地将基于nanopore的全长 RNA 测序方法与单核测序相结合,以捕获单核水平的异构体多样性,这可以通过提供除丰度之外的额外信息层来促进细胞类型分类和表征。
文末公告,联川出版社发布的《单细胞测序研究一本通3.0》已经正式上架销售,欢迎各位老师登陆微店“联川驿站”,或者扫描以下二维码购买新书!
多种售书方案随心搭,还有32G U盘(内含海量单细胞学习资料)购完为止,快来抢购吧!
滑动查看目录
相关阅读
所见即所得,绘图高规格联川云平台,让科研更自由