【RNA和cDNA】使用癌细胞系对 RNA 测序试剂盒进行的系统性评估
在转录组学中,很少有一个基因一种产物的模式。预测表明,每个基因平均具有 6.3 个转录本异构体[1],人类基因组中 95% 的复合外显子基因都有选择性剪接[2]。多种异构体的产生显著增加了基因表达的复杂性,从而也增加了基因分析的复杂性。
短读长 RNA 测序可受到系统偏向性影响,如GC偏向和PCR偏好。而这些可以通过使用纳米孔 RNA 测序方法来避免,尤其是使用无需扩增的方法。作为新加坡纳米孔——表达联盟(Singapore Nanopore-Expression Consortium)的一员,Jonathan Goke 博士从六株细胞系中生成了纳米孔测序数据,并通过直接RNA测序、或cDNA介导的测序(无论有无PCR扩增)生成全长 RNA 序列的纳米孔方法进行了评估。此外,Jonathan 希望建立质控和生物信息学工作流程,用于分析 RNA 测序数据和研究样本变差(sample variation)。
表 1 中显示了三种Oxford Nanopore RNA 测序试剂盒的起始样本要求和一般信息。Jonathan 在所有试剂盒上所获得的平均读长均超过 1000bp,其中,直接cDNA 测序试剂盒的读长最长。测试试剂盒和测试样品之间存在高度的技术重现性。
表1. Oxford Nanopore Technologies RNA 测序试剂盒
研究人员就长读长纳米孔 RNA 测序与短读长 RNA 测序方法进行了进一步的直接比较,发现短读长和长读长在基因水平上有非常高的相关性。这表明,纳米孔长读长数据与先前的短读长测序实验的数据“向后兼容”。
长读长纳米孔测序额外提供了偏向性更小且更为富集的数据集:首先,使用长读长纳米孔测序显著减少了短读长数据中存在的 3’端偏向性;其次,很少有短读长可跨越一个或多个剪接位点,而长读长数据则具有更好的读长分布,因此跨越多个剪接位点;最后,与短读长数据不同,纳米孔方法生成的大多数序列都定位到了单个参考转录本。
总体而言,与短读长数据相比,长读长RNA 测序数据中的偏向性显著降低,且在重复、实验步骤和平台上呈现出高度的一致性。
参考文献:
1. Pan et al. Deep surveying of alternative splicing complexity in the human transcriptome by high-throughput sequencing. Nature Genetics. 40, 1413-1415 (2008)
2. The ENCODE Project Consortium. An integrated encyclopedia of DNA elements in the human genome. Nature. 489, 57-74 (2012)
延伸阅读
RNA测序的变革:Oxford Nanopore推出新型cDNA测序试剂盒
Nanopore测序及分析实战基础培训班【上海03.14-03.15】
Nanopore测序初级实验和数据分析培训班【上海03.14-03.15】
Oxford Nanopore的产品现已接受网上订购,请打开“阅读原文”或者浏览以下网址:
https://store.nanoporetech.com/cn
如欲了解更多产品信息,请长按二维码关注我们。
媒体查询,请通过以下电邮及微信联络我们的团队:
media@nanoporetech.com或加微信ID: NanoporeMedia或tbray91ONT (Thomas)