查看原文
其他

干货:建库<10元的smart-seq3单细胞测序原理讲解(附smart-seq1/2原理)

市场部-SLZ 联川生物 2022-06-07

2020年5月4日,国际著名生物技术顶级期刊Nature Biotechnology(简称NBT)发表了来自瑞典卡罗琳医学院的Sandberg课题组最新文章,根据smart-seq2进行了一系列更新优化,公布了一项微量单细胞转录组新技术——smart-seq3。

卡罗琳医学院就是著名诺贝尔生理及医学奖诞生地,这位Sandberg博士曾在MIT进行了多年的博后训练,回到了这个顶级学府开启自己的PI生涯。他的学术研究几乎是CNS杂志的常客,不可谓不强悍。

接下来让我们来看看,这项smart-seq3究竟有什么令人眼前一亮的地方。

要想了解smart-seq3我们先来简单回顾下smart-seq技术延伸出来的几种常见的smart扩增与建库方法。

1传统smart-seq方法简介
1.1 常规SMART扩增法
如何在total RNA中有效扩增出mRNA而不是rRNA,这就需要用到CloneTech公司推出的SMART扩增法。其中最核心的技术,就是设计了2个特殊的引物,再配合用MMLV逆转录酶进行逆转录。
通过上图我们首先可以看到逆转录的起始引物1,最头上是一段通用序列,在后续的反应中这段通用序列将会用于PCR扩增引物的识别序列。中间的一长段T是专门用于识别mRNA的3’末端polyA尾结构的,并与这些polyA尾序列进行碱基互补配对并结合。
特殊引物1的3’最末端有一个定位的结构,由两个简并碱基构成,但在PolyT的3’端倒数第二个碱基是A、C、G而非T的简并碱基,而倒数第一个为简并碱基,这样做的好处是让它正好结合在mRNA的3’端连到Poly(A)尾巴的这个连接处,而不会结合到mRNA的别的地方。这样就保证了逆转录的起始位置正好是mRNA的3’端的序列终止位置。
MMLV逆转录酶,这个酶有个特点,就是它在转录到mRNA的5’端末端的时侯,会在新合成的cDNA的3’末端,多加出几个C碱基来。所以从上图中我们可以看到,在绿色部分,逆转录反应最后会在末端多形成几个C碱基。
特殊引物2由一段通用序列及它的3’端是3个非脱氧的G碱基构成,也就是核糖核酸的、RNA的G碱基,而不是DNA的G碱基,这个引物可以与刚才新合成的cDNA的3’端的那几个C碱基发生互补杂交,然后引导这个MMLV酶再次发挥聚合作用,以刚才那条新合成的cDNA为模板,复制的结果,就是得到双链的cDNA。
这个双链cDNA,两端都已经接好了人工设计的PCR引物序列,然后,就加入常规的PCR引物,进行常规的PCR扩增,得到大量DNA。上图中红色框框,也就是两端的通用引物序列是相同的,所以PCR扩增效率基本会保持一致。
所以从上图的比较图中可以看到,如果拿常规建库和SMART建库方法进行比较,我们会发现针对微量样本SMART扩增法具有非常大的优势。但是这种方法在构建时可能有以下几个缺点:
a. 对RNA质量要求比较高,不能分析RNA降解样本和FFPE样本;
b. 只能分析mRNA和部分带有polyA尾的lncRNA;
c. 若样本出现污染或处置不当,后续建库序列中会存在大量原核污染序列;
d. 分析上带来极大的误差,如比对率低、接头序列比例过高,表达水平误差较大
1.2 rRNA去除和SMARTer® Universal Low Input RNA扩增法
这种方法在2018年逐渐成为主流的低起始量测序解决方案,好处在于,rRNA去除后尽可能地保留了lncRNA、circRNA、mRNA等RNA信息在里面。另外这种方法也非常适合用于RNA降解样本、FFPE样本以及部分临床微量样本。
不同于方法一的SMART法,这款CloneTech名为SMARTer® Universal Low Input RNA Kit试剂盒的亮点在于,起始量可以低至200pg,针对2<RIN<3的降解样本以及FFPE样本具有特别好的效果。从上图中我们可以看到,不同于方法一中的常规SMART扩增法,这款试剂盒在SMART接头中引入了6N随机引物的概念。
所以根据我们目前查阅的大量论文来看,绝大部分课题组所使用的试剂盒以这款居多。
当然这种方法的弊端在于,样本中rRNA去除不干净导致后期下机数据中出现大量rRNA序列,而有效数据不会超过30%。另外就是老生常谈的一些问题,如原核序列污染(鉴于SMART高效的扩增效率)、后期比对率较低、接头序列过高等情况都会发生。这就是目前所有低起始量样本无法避免的问题,那就是噪音会被放大。那么这个时候需要另一款试剂盒登场了。
1.3 自带去除rRNA效果的smart pico法扩增
2019年,CloneTech公司推出了一款名为SMARTer® Stranded Total RNA-Seq Kit v2 - Pico Input Mammalian单细胞扩增及建库试剂盒,pico意味着RNA起始量很低,可以到pg级别。这款试剂盒最大的亮点在于不仅可以做到链特异性建库,而且还可以通过R-Probes与ZapR酶对带有rRNA(核糖体RNA)序列进行去除。
从上图中我们可以看到
① total RNA无论是高质量的RNA还是已经产生大量降解的RNA,都会进行一链cDNA合成,其中六碱基随机引物与方法二中的试剂盒中引物相似。
② 接下来第二步直接会连接上illumina的测序接头和barcode进行RT。
③ 第三步,会把RT后的文库用Beckman公司的AMPure磁珠进行片段化大小筛选,R-Probes与ZapR酶对rRNA(核糖体RNA)的cDNA序列进行剪切(cleavage)去除。
④ 第四步,将去除完rRNA后剩余的cDNA进行一轮PCR扩增后用AMPure磁珠进行片段化大小筛选。
⑤ 第五步,最后构建illumina测序文库。
其中一链合成的时间花费约为2小时15分,去除rRNA(核糖体RNA)需要花费1小时45分,其余步骤花费约为30分钟。这款试剂盒目前适用物种为人大小鼠等。尤其是一些短片段较多且无法在逆转录cDNA之前取出核糖体RNA序列的样本(包含FFPE或降解样本等)适用程度更高。

2smart-seq3横空出世
介绍完了上面三种常见的SMART扩增法后,接下来我们要正式进入本次文章的主角smart-seq3。
作者宣称smart-seq3的灵敏度会比原有的smart-seq2有显著提升,最后是基于Tn5转座酶和分子标签对预扩增产物进行测序文库的构建。
2.1 smart-seq3建库原理及优势
先来简单看下smart-seq3建库的大致流程,带有PolyA的RNA分子模板被逆转录,并在5‘端进行模板切换。在PCR预扩增之后,通过Tn5转座酶对cDNA模板进行随机酶切打断,最后产生了横跨整个mRNA全长的5’ UMI标记片段(带有UMI分子标签和template-switching oligo, TSO序列)和内部部分片段internal reads。
图b显示的是smart-seq3对96个细胞的平均基因体覆盖率,其中UMI reads为绿色,蓝色为internal reads的平均覆盖范围。
影响5‘ internal reads的比例包括转座酶的酶切效率、PCR扩增效率以及测序仪产生的bias等。因此我们从图c中可以看到,不同起始量Tn5转座酶对以及对应不同的cDNA起始量,对UMI reads的影响。
图d显示,与Smart-Seq2相比,Smart-Seq3在mRNA以及部分lncRNA的检测灵敏度上有显著提升。
当然针对上面提到的测序带来的bias,其实作者也观察到,剩余的TSO序列,会随着PCR被扩增出来,从而导致检测到的错误UMI增加。
但是无论如何,与Smart-seq2相比,不管是否携带UMI,Smart-seq3显著改善了基因表达谱中细胞与细胞之间的相关性,发现每个细胞检测到多达150,000个独特RNA转录本,复杂性显著提升。在使用smRNA-FISH对四个基因进行检测后作者发现,smart-seq3每个细胞检测远远大于smart-seq2,但仍比smRNA-FISH来的少。
这些数据均证实了smart-seq3强悍实力。
2.2 smart-seq3构建RNA全长的秘密
这个是本文中,最为令人叫绝的亮点之一。熟悉GBS建库的朋友们都知道在对基因组DNA进行酶切实验之前都会有一个电子酶切的过程。
组装RNA转录本时,主要由5’带有UMI reads来构建,但是3’ reads有所不同(绿色部分)。
所以在本文中,作者也会对RNA上的Tn5酶切位点进行电子预测,构建一个Tn5电子酶切库。之后根据UMI标签和零散的internal reads与前期电子酶切结果一起进行预测,从而用生物信息的方式重构了整个全长的RNA转录本。
当RNA转录本上出现SNP变异位点时,也能轻松捕捉这些变异信息。
这种smart-seq3建库方式即便是没有nanopore以及pacbio三代测序那么强悍,但是已经远远强于10X Genomics这种3’或5’只能测到部分RNA表达的测序模式。
在等位基因(allelic RNA)方面,smart-seq3显示出比smart-seq2更为强大的检测灵敏度,用线性模型量化细胞内基因间两种测量的一致性显示出很强的相关性。
2.3 与Pacbio三代测序的平行测试
为了研究RNA转录本通过smart-seq3技术可以被重建到什么长度,作者对细胞扩增实验中发现22196个RNA分子的重构长度为1.5kb或更长,大约200000个分子重构长度为1kb或更长。平均8710个RNA分子,每个细胞的平均长度为500bp或更长。
作者进一步通过PacBio三代测序,来比较smart-seq3和PacBio检测到的UMI,得到54,302个匹配的RNA分子,证明smart-seq3重构后的RNA分子,占据PacBio检测到的全长序列的46%。
理论上Col1a2这个mRNA长度为2.3k,接下来作者对这个Col1a2上的位点进行详细验证。其中Pacbio检测到的转录本长度为2.267kb ,而smart-seq3已经准确地重建了2.3kb转录本中的1.9kb。
2.4 smart-seq3应用场景检验
最后作者根据应用场景进行了一系列数据的佐证(此处省略数千字),总之这些验证的结果表明,smart-seq3在构建RNA全长转录本,SNP变异检测以及可变剪切产生的异构体上具有突出的能力
3结论
包含多个外显子的基因,通常通过可变剪切会产生多个转录本(isoforms),并对RNA和蛋白质产生诸多影响。传统的转录组RNA-seq测序方法在reads分布上会存在多个转录本共享overlap reads的情况,导致定量不准,最后可变剪切分析内容准确性有待商榷。
smart-seq3在解决上述问题的同时,还能增加RNA检测灵敏度,提升检测数量,提高可变剪切产生异构体的检测准确性。另外,RNA转录本上SNP变异信息的检测,也是smart-seq3的一大亮点。
这项技术的提升无疑会大大方便细胞亚群的鉴定。
与pacibo以及nanopore等三代全长测序技术相比,smart-seq3技术兼顾价格与效率,每次建库成本仅为10元人民币,就能检测到pacbio结果中约50%的全长RNA转录本,并分析SNP信息。
当然,如果三代测序配合smart-seq3,效果会更好。对于需要对每个细胞进行大规模平行鉴定的实验来说,smart-seq3最为合适不过。当然后期smart-seq3在RNA全长分子重构上仍有许多需要优化的地方,值得期待。

相关阅读

微量单细胞转录组smart-seq2细胞防污染注意事项

微量单细胞转录组smart-seq2样品包装运输指南

干货:做了几万次单细胞实验吐血得出10X文库PCR循环数的影响因素 | 单细胞专题

套路必读:烧钱做单细胞上顶级期刊有哪些潜规则 | 单细胞专题

单细胞测序文献精读05 | 用冷激活蛋白酶分离实体肿瘤组织用于单细胞RNA测序可以最小化保守胶原酶相关的应激反应(视频)


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存