环状RNA种类多样性伴随进化增高
声明
欢迎个人转发到朋友圈,公众号、自媒体、网站等媒体转载请联系授权,circRNA@163.com。
12月16日,RNA Biology杂志在线发表了陈玲玲教授和杨力教授共同通讯作者的研究论文,介绍基于生物信息学的分析发现环状RNA的种类多样性会伴随着物种进化程度而增多,绝大部分的环状RNA的形成过程均由短散在核重复序列(SINE)驱动,该研究也暗示SINE元件的在进化中的重要性(Dong et al., 2016)。下面就让我们一起学习一下这篇文章吧。
环状RNA越来越受到国内外科学家的关注,目前也积累了一定数量的研究数据。在人和小鼠的研究数据中,环状RNA的表达状态存在组织和疾病特异性的特征,更有趣的是人和小鼠中已知的环状RNA重合的非常少,那么造成这种现象的原因是什么呢?本文作者利用信息学技术深入探索了这个问题。概括而言,作者发现反向互补的短散在核重复序列(short interspersed nuclear repetitive DNA elements, SINE)是形成环状RNA的最重要因素,在小鼠和人中有重合的环状RNA都能找到对应的反向互补SINE。SINE在物种间的多样化分布可能导致了环状RNA在物种间多样性变化。
研究对象与方法:
作者收集了已发表的各种(Ribo–),(poly(A)–)或RNase R处理的RNA测序数据,利用CIRCexplorer2工具分析其中的环状RNA(数据与2016年6月30日发表的Genomic Research一致 (Zhang et al., 2016)),通过TopHat2/TopHat-Fusion(版本号2.0.9)比对分析。在人类中共收集到10万种环状RNA记录,小鼠中3.6万种。其中大约90%的环状RNA都在大脑组织中表达,这与之前其他的研究报道相符。通过归一化处理,作者发现在人类来源的样本中环状RNA的多样性程度要高于小鼠。从表达量最高的前100, 500, 1000的环状RNA来看,人类的样本中表达量也远高于小鼠,而它们所对应的线性RNA的表达量在人和小鼠中比较接近。人和小鼠的环状RNA普遍包含2至3个外显子,环化位点所对应的内含子区的长度也高于随机选择的对照。
图1 人和小鼠中已报道的环状RNA数量与特征比较(来自(Dong et al., 2016))
绝大部分的环状RNA为物种特异性的表达
作者接下来利用LiftOver tool分析了人和小鼠中环状RNA的同源性状况,结果共发现了1.5万种具有同源性的环状RNA。这些具有同源性特征的环状RNA总体表达量要高于物种特异性的环状RNA。这表明人和小鼠中同源性的环状RNA比例还是比较低的,是什么原因导致的呢?作者接下来分析了这些具有同源性的环状RNA所对应的基因组区域。同源性环状RNA所对应的基因组区的保守性略高于物种特异性环状RNA所对应的基因组区。有趣的是同源性环状RNA所对应的内含子明显比非同源性的环状RNA所对应的内含子长。
图2 物种特异性的环状RNA表达特征(来自(Dong et al., 2016))
作者比较了人和小鼠中有同源性的环状RNA以及物种特异性的环状RNA所对应的内含子中反向互补序列的情况,在人的基因组中两者的差别不大。但在小鼠基因组中的表现比较有趣,人类特异性的环状RNA所对应小鼠基因组中内含子区中反向互补序列明显减少,而在人和小鼠中存在同源性的环状RNA所对应的基因组区中反向互补序列则保持较高的比例。反过来在小鼠中也是同样的情形。概括而言,作者发现在人和小鼠中具有同源性的环状RNA所对应的内含子中反向互补序列也相对保守存在,而只在人或小鼠中存在的环状RNA所对应的内含子中反向互补序列更倾向于存在对应的基因组中。因此作者认为反向互补的内含子序列是驱动形成环状RNA的因素。
图3 内含子反向互补序列与环状RNA形成相关 (来自(Dong et al., 2016))
SINE是物种特异性环状RNA形成的重要因素
为准确分析环状RNA形成相关的反向互补序列的特征,作者引入互补指数(Complementary Sequence Index,CSI)进行分析。CSI指数综合考虑了互补配对序列的对称长度(Symmetry length,SL),互补配对能力(Pairing ability)和竞争结合因素(Competition)。如下图所示,对称长度SL指互补元件到内侧内含子边缘(环状RNA反向拼接的位点)的距离,由于两侧的这一长度会有所差别,因此SL实际包含了两个:长边和短边,分别记为lSL和sSL。配对能力的评价,作者用到了配对指数(Pair Score,PSacross)进行表征,PSacross = BlastScore/L2 ,其中L=lSL+sSL。竞争结合因素(Competition)的评价相对复杂,在反向互补的序列元件所在的内含子中,任何能竞争性结合该元件的序列因素都会削弱两者成功配对的几率,这表现为抑制目标元件成功配对的因素(PSi)。同样,抑制PSi竞争目标序列元件的因素则能促进目标元件的成功配对,这些因素则表现为促进目标元件成功配对的因素(PSe)。位于上游的竞争因素的计量公式为:PSup=Σ((PSi/(PSi+Σ(PSe))×PSi),下游的记为PSdown 。概括而言,目标元件所对应的内含子中竞争性因素表征为PSup+down=PSup+PSdown。将各项因素的计量结果综合考虑,即可对应的计量目标互补序列的互补指数(CSI),具体计量公式见下图。那么,CSI指数能否有效的计量评价目标序列的互补配对情况的?作者进行了验证,作者首先随机挑选了500个高表达的环状RNA进行分析,对照为500个随机抽取的有长度限制的内含子(8000nt长度,这是人类环状RNA对应的内含子的中位长度),以及没有长度限制的内含子。分析得到了AUC值分别为71.4% 和86.4%,这一指标用于表征所选用的分析方法的精确性和敏感性。作者也进行了数据放大,分别分析了高表达的1000个和5000个环状RNA的情况,对照用了≥8000nt的内含子。结果也比较相似。这证明了CSI指数进行序列互补能力评价的可行性。
图4 互补指数(CSI)计算原理 (来自(Dong et al., 2016))
基于CSI计量分析,作者分别分析了人和小鼠的环状RNA所对应的内含子中反向互补序列的情况。在人类的基因组中,绝大部分环状RNA对应的内含子均含有较强的反向互补原件,其中绝大部分是Alu序列,也有少数包括LINE(长散在核重复序列)在内的序列原件构成的反向互补序列。反向Alu元件的CSI指数打分明显高于其他类型的反向互补序列。在小鼠中,环状RNA对应的反向互补序列则表现出多元化的特征,比较多的是B1,B2和LINE等。同样的,反向SINE元件的CSI指数打分明显高于其他类型的。值得一提的是在人类基因组中的反向Alu元件的CSI打分要比小鼠中反向SINE的打分高。非重复的可互补序列(Non-repetitive)的CSI指数打分更高,但在人和小鼠中都非常少。
图5 人和小鼠中circRNA相关反向互补序列分析(来自(Dong et al., 2016))
小鼠和人的环状RNA这些差异会不会是进化相关的情形呢?作者利用同样的方法分析了蠕虫(Worm)和果蝇(Fruitfly)中环状RNA的情况。环状RNA的数目在蠕虫,果蝇,小鼠和人中依次递增。基于测序深度的数据归一化处理后,作者也发现,人类的环状RNA表达量也明显高于其他物种,环状RNA的表达量总体变化趋势与进化程度对应。选取3263种直向同源基因分析后结果也表明环状RNA的数目和表达量均伴随进化程度而呈现明显递增趋势,其中RPKM大于1.0的1345中基因的也是如此。
图6 环状RNA的种类随着物种进化程度增高而增加 (来自(Dong et al., 2016))
伴随进化而增多的SINE元件与环状RNA表达多样性增加相对应
从上面的分析,作者提出了一个假设:在后生生物中,会不会随着物种进化,SINE会增多进而导致环状RNA增多?于是作者分析了四种模式生物的全基因组中SINE的数目以及存在于内含子的SINE的情况,结果表明随着物种的进化,不仅SINE的数目增多,互补配对的能力(CSI指数)也明显增高。这表明随着物种的进化,SINE在基因组中分布的增多以及互补配对能力的提高均有助于环状RNA的形成。作者也发现在人类的转录组中环状RNA的可变剪切情况要比其他物种更常见。例如,作者就在人类的胚胎干细胞细胞系H9中的RERE(Arginine-Glutamic Acid Dipeptide Repeats) locus找到了16种环状RNA可变剪切形式,而同一基因在小鼠中只有9种环状RNA,果蝇中只有2种,蠕虫中则没有发现。
图7 互补序列的数目和互补能力均随物种进化程度而提高 (来自(Dong et al., 2016))
本文借助互补指数(CSI)进行定量化分析反向互补元件的互补配对能力,分析了与环状RNA形成有关的SINE的进化特征,发现伴随着进化进程,SINE的数目明显增多,互补配对的能力也逐渐提高,与此对应的是环状RNA的种类和表达量均有提高。暗示了反向互补的SINE元件可能是驱动环状RNA形成的决定性因素,这为进一步认识环状RNA的进化机制提供了重要的参考。一些更深层次的科学问题还有待进一步分析,比如伴随物种进化进程而增多的SINE元件和互补配对能力否由自然选择压力决定?这一增高趋势为物种进化带来了什么进化优势?由此导致的环状RNA种类和表达量的增多在进化上有什么意义?这些问题都有待进一步的研究。
参考文献:
Dong, R., Ma, X.K., Chen, L.L., and Yang, L. (2016). Increased complexity of circRNA expression during species evolution. RNA biology.
Zhang, X.O., Dong, R., Zhang, Y., Zhang, J.L., Luo, Z., Zhang, J., Chen, L.L., and Yang, L. (2016). Diverse alternative back-splicing and alternative splicing landscape of circular RNAs. Genome Res.
近期热文
2
3
4
5
6
circRNA
最新研究进展 分享科研干货
环状RNA交流群
分享研究技巧 经验交流平台
点击“阅读原文”