查看原文
其他

circAtlas: 多物种circRNA表达数据库

circRNA circRNA 2021-02-21

欢迎个人转发到朋友圈,公众号、自媒体、网站等媒体转载请联系授权,circRNA@163.com。


3月19日,Cell Reports杂志在线发表了中科院北京生命科学研究院赵方庆研究员团队的一项工作,鉴定了人类及其他多种动物正常组织的转录组,组装了其中大部分circRNA的全长序列,汇总形成circRNA数据库(circAtlas)[1]。

数据库主页:http://circatlas.biols.ac.cn/



circAtlas数据库总体情况概览

circAtlas数据库目前已收录了包括人(Homo sapiens)、猕猴(Macaca mulatta)、小鼠(Mus musculus)、褐家鼠(Rattus norvegicus)、野猪(Sus scrofa)和鸡(Gallus gallus)。这些物种中circRNA和样品数目,组织种类数目见下图。

图1 circAtlas数据库收录信息总体情况 

(来自circAtlas网站)

C:circRNA number;

S:sample number; 

T: tissues number.


circRNA可变剪切广泛存在

作者首先分析了circRNA中可变剪切的情况,结果表明在人,猕猴和小鼠中四种可变剪切均能检测到,外显子跳跃(Exon Skipping,ES)形式的可变剪切最多,其次为3’-可变剪切(alternative 3’-splicing site,A3SS)和5’-可变剪切(alternative 5’-splicing site,A5SS),内含子保留(Intron Retention, IR)形式最少。

图1 circRNA可变剪切情况 (引自[1]

 

多数蛋白编码基因都有一种显著高表达的circRNA 

编码基因中往往存在多种剪切变体的情况,且经常是以其中一种作为主要的剪切变体形式。那么这种情况会不会在circRNA中存在呢?作者分析了circRNA与其来源基因的表达状态分析,将表达丰度最高的作为Major形式,次高的作为Minor形式。如果Major形式的丰度大于Minor的两倍以上,就称Major形式为Dominant。脑组织来源的数据分析表明,23%的基因存在Dominant的circRNA,其中8%的基因Dominant形式表达丰度是Minor形式的五倍以上。那么在不同组织中Dominant形式是否一致?作者分析的结果表明Dominant形式往往表现出较低的组织特异性。此外,Dominant形式的mRNA和circRNA是否具有共享的外显子序列?作者按照Dominant形式的mRNA和circRNA共有序列的一致性分为完全一致(Totally),部分一致(Partially)和完全不一致(None)三种类型,然后分析了不同组织中三类基因的数目,结果显示,Dominant形式的mRNA和circRNA共有序列完全一致的占比约50%,部分一致的占约20%,还有30%左右的两者的序列完全不一样。这说明很多Dominant形式的circRNA并非是Dominant形式的mRNA剪切副产物。


图2 多数mRNA仅有一种显著高表达的circRNA (引自[1]

 

RNA结合蛋白是组织特异性circRNA形成的关键 

RNA结合蛋白(RBP)是circRNA形成的重要调控因子,作者分析了circRNA表达与mRNA表达和RBP的相关性,结果表明circRNA的表达与RBP的表达相关性远高于mRNA。RBP也表现出更强的组织特异性表达特征。RBP是circRNA组织特异性表达的重要调控机制。


图3 circRNA表达与RBP相关 (引自[1]

 


直系同源circRNA在物种间高度保守

在该项工作中,作者进行了三种物种的测序分析,同源性分析发现了一个有趣的现象:在不同物种中存在一类重叠的直系同源circRNA分子(overlapped orthologs,OO-type),就是指在不同物种中剪切位置高度保守的circRNA分子。直系同源的mRNA表达情况在物种间的一致性明显比OO-type circRNA高。有少数的OO-type circRNA表达丰度甚至远高于来源基因,暗示这些分子或许具有特殊的重要功能。OO-type circRNA组织特异性较差,它们的侧翼内含子中具有更多的重复序列,它们的剪切方式也更稳定保守。


图4 直系同源circRNA (引自[1]


circRNA与mRNA共表达网络分析

共表达网络分析共得到33,512,072条共表达信息,38,532个节点。如果一个节点相关的共表达信息越多,表明这个节点具有越重要的衔接功能。在这个网络中,衔接最多的前50个节点中,circRNA占到42个。


RBP在circRNA的形成过程中起重要作用,因此作者挑选了几个RBP进行干扰,然后分析干扰后circRNA表达受影响的情况。作者选择了TRA2B,MBNL1和PTBP1在Hela细胞中进行分析,此外已公开发表的干扰DHX9和QKI的数据也一起用于这一分析。结果显示这些RBP敲降后显著影响了一些circRNA的丰度。作者也分析了m6A修饰相关的蛋白与circRNA的共表达关系,结果表明eIF4G比eIF4E对m6A修饰的circRNA相关性更高。


图5 circRNA与mRNA共表达分析 (引自[1]

 

此外作者还分析了直系同源的circRNA与mRNA在不同物种间的保守性网络。相关的测序数据构建了circAtlas数据库。目前的数据库中涵盖的数据已超过文章描述的内容,用户可以通过该数据库获得circRNA的序列信息,可以查看不同物种中保守的circRNA分子相关的信息,还可以利用该数据库分析circRNA的miRNA或RBP结合情况,分析circRNA分子中的ORF和IRES元件。用户也可以查找一些疾病相关的circRNA分子。具体使用方法可登陆数据库查看教程。


数据库主页:http://circatlas.biols.ac.cn/



参考文献

1. Ji, P., et al., Expanded Expression Landscape and Prioritization of Circular RNAs in Mammals. Cell Rep, 2019. 26(12): p. 3444-3460 e5.



1

荐读 | 环化的RNA不诱发免疫反应,且可以高效翻译蛋白

2

荐读 | 多样本circRNA可变剪切比较新工具——CircSplice

3

第五届circRNA研究论坛 | 第一轮通知

4

荐读 | hsa_circ_001783与三阴乳腺癌的关系

5

小结 | 3月上半月circRNA研究报道汇总

6

荐读 | 研究RNA与蛋白相互作用的方法






“circRNA”微信公众平台由

『广州吉赛生物科技股份有限公司』运营,

旨在为circRNA研究同行

提供最新科研资讯和研究方法,

服务广大生命科学工作者和医学工作者。


如果您有好的文章或Idea,

千万别让它埋没,

欢迎大家分享或投稿。

小编在编辑微文时特别鸣谢,

另有惊喜送出!

投稿邮箱:circRNA@163.com


点击下方图片,长按扫描并关注,一起涨知识吧!

点击“阅读原文”




    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存