什么?转录组测序竟能如此简单高效!
随着二代测序的普及和测序成本的大幅下降,通过RNA-seq进行转录组分析已经成为生物医学研究的常规操作。但对于低起始量样本而言,测序仍不理想,主要原因是实验中的纯化会导致大量样本损失。并且它依赖二链互补合成的DNA,增加了实验时间和纯化步骤。
虽然许多单细胞RNA-seq测序方法也被推广,然而对于大多数这些方法来说,很难同时实现高通量和高准确性。单细胞RNA-seq方法,如Smart-seq2是引入预扩增来解决低起始量问题,但这种方法可能会有误差,影响准确性。
本文提出了一种使用细菌转座酶Tn5来构建不需要二链合成的RNA-seq文库。作为RNaseH超家族成员,Tn5转座子可以随机结合RNA/DNA杂合链,结合类似于dsDNA,并可以有效地片段化,然后直接在RNA上添加测序接头。这种方法被称为RNA-DNA-hYbrid(SHERRY),通过简化的实验流程大大提高了低起始量RNA-seq的可行性。
从高起始量RNA到单细胞,SHERRY可以处理各种数量级的样本,这种方法适用范围广泛且可操作性强。与目前主流的RNA-seq方法相比,他提供了一个非常简化的方案,缩短了时间,降低了成本。产生的结果也具有很高的重复性和准确性。为现有方法难以处理的低起始量样本提供了解决方案。
小结
1. Tn5可以有效的识别RNA/DNA杂合链,并标记和片段化。
2. 片段化长度小于100nt。
3. 接头可以有效识别片段化后的RNA/DNA杂合链,并连接在DNA链和RNA链上。扩增主要以cDNA为主体。
4. 用200ngHEK293T总RNA作为起始建库,测序结果显示人类基因组的定位率>90%,外显子率约80%,检测到近12,000个基因。插入片段长度小于100bp。
5. SHERRY和NEBNextUltraII试剂盒性能比较
SHERRY | NEBNextUltraII | |
起始量 | 10ng和200ng | |
检测基因数 | 更高,重复性更好 | |
差异基因 | 高度相似 | |
时间 | 少手动操作,更短的时间,大约可以节约2小时 |
总结:SHERRY和NEBNextUltraII试剂盒性能相似,但SHERRY操作更简单,且能节约更多的时间。
6. scSHERRY和Smart-seq2性能比较
scSHERRY | Smart-seq2 | |
样本 | 单细胞或微量样本(100pg) | 单细胞 |
建库 | 不含第二链合成和预扩增 | 需要预扩增 |
时间 | 节省了大约4小时 | |
成本 | 低5倍 | |
文库 | 质量较好,对GC含量较低的基因无明显富集 | 对GC含量较低的基因有明显富集 |
基因数量和覆盖均匀性 | 略差 | 更高,但可能引入偏差 |
重复性 | 更好 | |
两种方法基因相关性 | 很高 |
从时间,成本和数据上来看,SHERRY相对于常规RNA文库制备方法和微量样本文库制备方面都具有很强的竞争优势。
劣势:SHERRY只是逆转录全长RNA。逆转录酶的效率低是众所周知的,延伸时转录酶很难到达RNA模板的5'端。这会导致转录本之间的覆盖不平衡,使RNA-seq信号偏向于基因的3'端。
目前的解决办法是在逆转录缓冲液中加入了模板转换寡核苷酸引物,其序列和浓度与Smart-seq2方法相同。以模拟Smart-seq2逆转录条件。这大大提高了转录本的均匀性,但一些测序参数相应下降。
本研究结果
1.验证Tn5的结合能力和片段化能力
Tn5是RNA酶(RNHL)超家族的成员,还有RNaseH和MMLV逆转录酶;为了验证我们的假设,我们使用pTXB1质粒和相应的方法纯化了Tn5。我们使用从HEK293T细胞中提取的mRNA制备了RNA/DNA杂合体。
使用标准的dsDNA标记方法,用0.6ulpTXB1Tn5转座体处理了15ngRNA/DNA杂合体。标记的RNA/DNA杂合链的片段分析显示,与未处理的对照相比,片段大小明显减小(~1000bp),验证了Tn5片段化杂合链的能力(图1D)。
2.Tn5构建文库方法
基于Tn5转座体片段化RNA/DNA杂合链的能力,我们提出了SHERRYRNA-seq文库构建方法(图1E)。SHERRY由三个部分组成:RNA逆转录、RNA/cDNA杂交标记和PCR扩增。
具体而言,使用oligo-dT引物将mRNA逆转录为RNA/cDNA杂合链。然后通过pTXB1Tn5转座体标记杂合链,将部分测序接头添加到片段末端。然后DNA聚合酶在初始末端延伸后将cDNA扩增到测序文库中。整个工作流程只需要大约4小时,手动时间不到30分钟。
3.验证转座子接头连接位点
为了进一步研究RNA/DNA杂交标记的详细分子情况,我们设计了一系列验证实验。首先,我们想验证转座子接头是否可以连接到片段化RNA的末端(图2A)。每个测试由两个重复的200ngHEK293T总RNA作为起始。
假设Tn5将接头同时连接到片段化的DNA链和RNA链,则接头可以作为后续延伸步骤中的模板。延伸后,DNA链的5'和3'端都应有一个引物结合位点,用于PCR扩增。则RNaseH处理不影响测序文库的生成。如果Tn5未能将接头连接到RNA链,则杂合链的两条链都不会转化为测序文库。
PCR扩增后,获得大量产物,表明接头已成功连接到片段化后的DNA。来自测试和SHERRY的测序结果显示,人类基因组的定位率>90%,外显子率约80%,检测到近12,000个基因。插入片段长度小于100bp。
4.标记的cDNA是首选的扩增模板
接下来,我们研究了是否可以扩增RNA、DNA链来形成测序文库(图2C)。我们在逆转录过程中用dUTP替换dTTP,然后纯化标记的产物以去除游离的dUTP和Tn5蛋白。
Bst2.0WarmStartDNA聚合酶用于延伸,它能够使用RNA作为引物并识别模板中的dU碱基。然后用USER酶或RNaseH处理产物片段以分别消化cDNA和RNA。我们使用USER消化的产物进行了RT-PCR,以测试将标记RNA转化为文库构建的效率(链测试1)。为了排除未消化DNA的干扰,我们使用dU兼容聚合酶(链测试2)对USER消化的片段进行了PCR扩增。
我们还使用dU兼容PCR来测试转换标记cDNA用于文库构建的效率(链测试3)。为了进行比较,我们增加了一个与StrandTest3相同的对照实验(dU-SHERRY),省略了RNaseH消化步骤,以确保Tn5可以识别带有dUTP的底物。
基于这些结果(图2D),我们得出结论,标记的cDNA大部分大部分可以形成最终测序文库。
5. SHERRY用于RNA-Seq文库制备。
我们测试了不同的反应条件以优化SHERRY,以10ng总RNA作为起始。测序结果显示,性能几乎没有变化,这表明SHERRY在各种条件下都是稳定的。
然后,我们将优化的SHERRY与用于成熟的市售文库制备试剂盒NEBNextUltraII进行了比较。其最小起始为10ng总RNA。我们使用10ng和200ng总RNA测试RNA-seq性能,每个条件三个重复。SHERRY在两个起始水平上展现了与NEBNext相当的性能。对于10ng起始,SHERRY产生了更精确的基因表达数量(图3A),可能是因为SHERRY操作流程更简单。
接下来,我们比较了SHERRY和NEBNext检测HEK293T和HeLa细胞之间差异基因表达的能力。在三个重复中,SHERRY具有更高准确度且重复性好。SHERRY和NEBNext鉴定的检测基因数量及其读取数量高度一致(图3C)。
然后我们绘制了不同细胞类型和文库制备方法之间距离矩阵的热图(图3D)。来自相同细胞类型的文库按预期聚集在一起。来自相同方法的文库也聚集在一起,表明两种方法存在内部偏差。
使用DESeq2检测差异表达的基因,两种方法检测到的数千个差异表达基因高度相似,并且它们的表达倍数变化在SHERRY和NEBNext之间高度相关(相关系数R2=0.977)(图3E)。对仅在一种方法中显示差异表达的基因的检查,揭示了来自另一种方法的数据中相同的表达变化趋势(图E)。
我们的结论是SHERRY提供与NEBNext一样可靠的差异基因表达信息,但过程更快且工作强度更低,特别是节省了大约2小时的手动操作时间。
6. 微量RNA或单细胞进行SHERRY
接下来研究了SHERRY是否可以从单细胞构建RNA-seq文库。首先,我们将RNA起始量减少到100pg,相当于大约10个细胞的RNA。SHERRY结果质量很好,定位和外显子率高,检测到近9,000个基因(SI附录,图S6A)。72%的基因在所有三个重复中都检测到,证明了良好的重复性(图4A)。这些基因的表达显示出极好的精确度,R2范围从0.958到0.970。(图4B)。
为了进一步提高检测极限,我们使用HEK293T细胞系进行了单细胞SHERRY实验(scSHERRY)。与纯化RNA的实验相比,scSHERRY需要对标准方案进行多次优化(图4C)。优化后的scSHERRY以50.17%的映射率检测8,338个基因(SI附录,图S6D),并且基因读数与Smart-seq2相关性良好(相关系数R2=0.600)。
此外,scSHERRY显示出比Smart-seq2更好的重复性(图4D)。与Smart-seq2相比,scSHERRY生成的文库的基因数量和覆盖均匀性略差,因为Smart-seq2通过预扩增步骤富集全长转录本。然而,Smart-seq2的这一富集步骤也引入了误差(图4E)。
我们使用200ngHEK293T总RNA,用NEBNext试剂盒构建测序文库,期望捕获尽可能多的基因。此外,NEBNext建议使用短RNA片段进行逆转录和更少的PCR循环数,这应该比其他方法减少GC偏差。然后我们将scSHERRY或Smart-seq2检测到的基因的GC分布与NEBNext结果进行了比较。scSHERRY不含第二链合成和预扩增,产生了与标准相似的分布。
然而,来自Smart-seq2扩增的单细胞RNA(scRNA)的文库显示出对GC含量较低的基因的明显富集。GC含量高的基因不太可能被Smart-seq2捕获,这可能会导致定量结果有偏差。
总体而言,与Smart-seq2相比,scSHERRY生成的文库具有相当高的质量和较低的GC偏差。此外,scSHERRY操作方法在标记之前省去了预扩增和QC步骤,节省了大约4小时。
SHERRY用于微量样本的性能比较
不足之处
尽管具有易用性和商业前景,但SHERRY生成的文库质量可能会受到转录本覆盖不均匀性的限制。与NEBNext试剂盒(在逆转录前对RNA进行片段化)或Smart-seq2(进行预扩增以富集全长cDNA)不同,SHERRY只是逆转录全长RNA。
逆转录酶的效率低是众所周知的,当使用polyT作为引物进行延伸时,转录酶很难到达RNA模板的5'端。这会导致转录本之间的覆盖不平衡,使RNA-seq信号偏向于基因的3'端(图S11A)。为了解决这个问题,我们在逆转录缓冲液中加入了RT引物,其序列和浓度与Smart-seq2方法相同。以模拟Smart-seq2逆转录条件。
然后按照标准SHERRY工作流程对所得杂交体进行标记和扩增。这大大提高了转录本的均匀性(图S11A和B),尽管一些测序参数相应下降(图.S11C)。我们相信,随着持续优化,SHERRY将提高RNA-seq的性能。
相关阅读
点击下方图片进入云平台资料汇总:
所见即所得,figure有bi格
联川云平台,让科研更自由