Nucleic Acids Research在线发布肿瘤特异性circRNA数据库
欢迎个人转发到朋友圈,公众号、自媒体、网站等媒体转载请联系授权,circRNA@163.com。
声 明
9月28日,Nucleic Acids Research杂志在线发表了武汉大学何春江教授和UT health Science Center韩冷教授为共同通讯作者的文章,介绍发布一个全新的肿瘤特异性circRNA数据库:CSCD(cancer-specific circRNA database,网址:http://gb.whu.edu.cn/CSCD)[1]。
CSCD数据库从ENCODE中收集了19种肿瘤类型的87种细胞系及141种正常细胞的circRNA数据,构建了该数据库。总共汇总得到了272152种肿瘤特异性的circRNAs,950962种正常细胞特异的circRNAs,还有170909种为肿瘤和正常样本共有的。
图1 CSCD数据库circRNA信息汇总 (来自[1])
数据库概览
CSCD数据库页面比较简洁,可通过sample type、sample name、gene symbol 及circRNA ID等信息进行检索。还给出了基因界面和circRNA界面的信息。基因界面包含了所对应的基因可变剪切与circRNA的总体情况,能通过页面直接连接至circRNA界面。circRNA界面则包含了circRNA对应的外显子,miRNA response elements(MRE),RNA结合蛋白结合位点(RBP)还有预测的开放阅读框架(ORF)。
图2 数据库概览 (来自[1])
CSCD数据库共收集了1394023种circRNA分子,其中外显子来源759039种,内含子来源436668种,基因间序列来源122806种。来自mRNA的1153542种,来lncRNA的42165种。预测到了MRE 76439955个,RNA结合蛋白结合位点103927037个,ORF 3462097个。
图3 CSCD数据库汇总circRNA相关信息 (来自[1])
肿瘤特异性circRNA如何分析的?
利用了四种常用的反向拼接算法:CIRI2、find circ、circRNA finder和Circexplorer。利用CIRI2分析相关的外显子信息。按照至少一种算法中至少一个Reads的标准进行筛选分析的。采用了GRCh37基因组注释,也提供了GRCh37和GRCh38之间切换的注释。由于本数据库的收录条件非常宽松,极大提高了circRNA记录的数量,典型的如CDR1as,在circBase中只收录了一种序列信息,但CSCD数据库分析收录了17种。
CSCD数据库分析功能介绍
亚细胞定位
相关研究表明circRNA存在特定亚细胞定位。CSCD数据库系统收录了相关的信息。肿瘤特异性的circRNA中共有19228种为胞浆定位,2107种为不溶性细胞质组分定位,7020种为膜定位,35734种为染色质定位,37453种为核定位,37141种为核质定位,16976种为核仁定位。
预测MRE
在junction point位点上下游各50bp范围内分析了相关的miRNA 结合位点。肿瘤特异性circRNAs中共分析了14921788个MRE位点,正常样本的circRNA中分析了52417822个MRE位点,在共同的circRNA中分析了9100345个MRE位点。
预测RBP
基于STARBASE中37种RNA结合蛋白的CLIP数据,在肿瘤特异性circRNAs中共分析了15719824个RBP位点,正常样本的circRNA中分析了66182210个RBP位点,在共同的circRNA中分析了22025003个RBP位点。
预测ORF
利用ORF Finder工具分析了相关circRNA的ORF情况,设置ORF条件为大于300nt,共在肿瘤特异性的circRNA中预测到564 047个ORF,在正常样本的circRNA中预测了2287210个ORF,在共同的circRNA中分析了610840个ORF。
相关基因可变剪切分析
相关的RNA-seq数据中利用STAR进行了分析比对,利用rMATS分析了环状RNA相关线性基因中存在的各种可变剪切方式。
CSCD还提供了到UCSC浏览器及circBase的链接,并且给出了每个样本和每个算法中预测得到的junction reads数以及相应的均一化表达量SRPTM,可以方便地进行不同样本的环状RNA丰度比较。CSCD数据库较详细的汇总了目前肿瘤相关circRNA的研究数据,为相关同行提供了非常有价值的工具,助力circRNA研究。
致谢:本文撰写过程中得到了何春江老师的大力支持,给出了很多宝贵的修改意见,在此表示衷心的感谢!
参考文献:
1. Siyu Xia, J.F., Ke Chen, Yanbing Ma, Jing Gong, Fangfang Cai, Yuxuan Jin, Yang Gao, Linjian Xia, Hong Chang, Lei Wei, Leng Han and Chunjiang He, CSCD: a database for cancer-specific circular RNAs. Nucleic Acids Research, 2017.
近
期
热
文
2
3
4
5
6
重磅!JNCI在线发表研究论文:circRNA翻译具有重要生物学功能的蛋白质circRNA
最新研究进展 分享科研干货
环状RNA交流群
分享研究技巧 经验交流平台
点击“阅读原文”