2019年4月14日,中国科学院北京生命科学研究院、动物研究所及中国科学院大学等多家单位合作在RNA Biology(IF=5.216)上发表题为“Long-read direct RNA sequencing by 5’-Cap capturing reveals the impact of Piwi on the widespread exonization of transposable elements in locusts”的文章。Nanopore 长读长Direct RNA测序不需要经过反转录可获得完整的RNA转录本。该研究结果证明了5’-Cap捕获法的Direct RNA测序在描述包含重复序列的全长RNA转录本中具有重要作用。这是国内Direct RNA测序相关研究成果的首次亮相,武汉未来组承担了Direct RNA的建库测序工作。
▶
飞蝗(Locusta migratoria)基因组较大,积累了大量的具有内在转录活性的转座子(TEs),TEs插入到内含子中被剪切机制识别,当做外显子添加到RNA转录本中的过程被称为外显子化。外显子化的TEs产生大量的高度相似的片段,运用短读长测序技术很难获得准确的全长RNA转录序列。本研究通过 5’-Cap捕获的方法富集全长RNA转录本,通过Nanopore对RNA直接进行测序,以天然RNA形式描述飞蝗全长转录本特征。外显子化的TE包含大量的剪接供体和受体位点,有助于形成可变剪切转录本。研究者分析了蝗虫转录中TE外显子化模式,揭示了TE外显子化的广泛建立以及蝗虫转录组中TEs对RNA剪接的重要作用。此外,TEs的表达受Piwi蛋白的限制,分析Piwi表达对包含有TE衍生序列的RNA转录本图谱的影响,结果表明TE衍生序列是Piwi介导的抑制作用的主要靶点,Piwi的表达调控了包含TE衍生序列的RNA转录本长度,产生了可替代的UTR调控。
▶
飞蝗(Locusta migratoria)基因组高达6.5 Gb, 其中转座子(TEs)序列占比高于65%,且大部分具有转录活性。因此,飞蝗可作为研究大型基因组TE结构和功能的理想模型。本研究以羽化的飞蝗为研究对象,通过 5’-Cap捕获的方法富集全长RNA转录本,5’-生物素化的RNA转录本通过耦合的链霉亲和素免疫磁珠捕获。通过Nanopore对RNA直接进行测序(Fig.1)。
Fig.1 5ʹ-Cap捕获的方法富集全长RNA转录本流程
▶
1.5ʹ-Cap捕获方法可富集全长RNA转录本
Nanopore Direct RNA测序作为一种新开发的技术只在少数几个物种中被应用。为了验证其在蝗虫中的可靠性,研究者测定了蝗虫转录组中转录本长度、序列一致性、Isoform覆盖度以及检测的基因数目,结果表明该测序方法可以精确获得蝗虫RNA转录本。
通过Fig.1所示的流程富集全长RNA转录本,RNA转录本5ʹ-末端合成的RNA接头(分为短接头文库和长接头文库)用作序列标签评估RNA转录本的完整性,短接头文库和长接头文库分别产生457,470和269,712条高质量reads。为了验证5ʹ-Cap捕获方法的有效性,研究者检测5ʹ-末端到3ʹ-末端接头的覆盖度,结果发现在长接头文库中大部分鉴定到的接头在5ʹ-末端,但是在长接头文库中5ʹ-末端没有接头富集(Fig.2a)。检测序列一致性及转录本比例,发现其均随长接头序列的减短(沿5ʹ-末端缩短)而增加(Fig.2b)。表明Direct RNA测序获得的RNA转录本5ʹ-末端的极端序列准确性较差。进一步使用长接头5ʹ-Cap富集文库的序列评估RNA转录本的基因覆盖度,编码区和非翻译区域整体覆盖度很好(Fig.2c),表明5ʹ-Cap捕获方法的Direct RNA测序可以获得全长CDS。
Fig.2 5ʹ-Cap捕获的方法富集全长RNA转录本效果验证
2. 大量的RNA转录本包含外显子化的转座子序列
以最长的RNA转录本作为每个转录本单元的代表序列,在60,908条代表序列中,51.88%(31,599)至少包含1个TE衍生序列,TEs序列长度占整个蝗虫转录组的19.94%。其中,37.45%为DNA转座子,32.93%为non-LTR 逆转录转座子,29.63%为LTR 逆转录转座子(Fig.3a)。家族间的频率分析表明,没有一个特定的家族主要促使其他家族成员的TE共现(Fig.3b)。由此可见,在大部分的RNA转录本中可观察到TE衍生序列的外显子化,并且不同的TE家族对蝗虫的RNA转录本作用不同。进一步分析发现,与5ʹ-UTR和3ʹ-UTR区域相比,编码区显示对TE外显子化更强的选择,而相比于3ʹ-UTR,5ʹ-UTR对TE外显子化更容易(Fig.3c)。
Fig.3 蝗虫转录组TE事件
3.Piwi的表达影响包含TE衍生序列的RNA转录本的长度
80%以上包含TE衍生序列的RNA转录本被认为是蝗虫的转座子,大量的转座子随着Piwi的沉默表达量上调(Fig.4a),RNA干扰的Piwi表达对蝗虫转录组中编码基因的表达有重要影响。dsPiwi样本TE衍生序列的覆盖度高于dsGFP样本,表明dsPiwi样本TE衍生序列内含物水平更高(Fig.4b)。为了探明TE衍生序列产生的可变剪接事件是否与dsPiwi样本更高水平的内含物有关,研究者检测了可变外显子中的TE衍生序列,只有少数(9.82%)可变剪接事件与TE衍生序列有关,大多数(96.88%)TE衍生序列的外显子在dsPiwi和dsGFP中均有发现(Fig.4c),表明可变剪接不是dsPiwi样本更高水平内含物的主要因素。进一步研究发现dsPiwi样本中双表达包含TE衍生序列的RNA转录本长度显著高于dsGFP样本,但是,双表达不包含TE衍生序列的RNA转录本长度在两个样本中没有显著差异(Fig.4d)。dsPiwi样本和dsGFP样本中蛋白编码转录本序列长度的差异主要是由于5ʹ-UTR和3ʹ-UTR区序列的变化而不是CDS区域序列的变化引起的,暗示了由Piwi表达介导的可替代的UTR调控。
Fig.4 Piwi RNA沉默后TE表达活性增强
总之,该研究结果证明了5’-Cap捕获法的Direct RNA测序在描述包含重复序列的全长RNA转录本中具有重要作用。
不经反转、无须扩增的RNA直接测序能获得全长的链特异性RNA,无测序偏好性,并同时记录碱基修饰,为后续研究基因结构和基因表达,提供新技术新方法。未来组作为国内最早通过官方认证的Nanopore测序服务供应商,已有多个Direct RNA测序项目经验,新技术还能带来哪些新机遇呢?组学君诚邀您一起探索!
参考文献
Feng Jiang, Jie Zhang, Qing Liu, Xiang Liu, Huimin Wang, Jing He & Le Kang (2019): Long-read direct RNA sequencing by 5’-Cap capturing reveals the impact of Piwi on the widespread exoniza- tion of transposable elements in locusts, RNA Biology, DOI:10.1080/15476286.2019.1602437