CIRCpedia数据库网站使用方法简介
环形RNA的研究日益受到学术界重视,相关测序数据也快速增长。目前,利用高通量测序和计算分析的方法,在人类细胞和组织中已发现了数万个环形RNA新分子,而在包括小鼠、果蝇、线虫等其他物种中也有数量惊人的环形RNA报道。中科院上海生科院计算生物学研究所杨力研究组利用建立的高效环形RNA分析流程CIRCexplorer2,对多种(目前主要是人和小鼠)组织和细胞系样品中的环形RNA进行计算生物学预测分析,并进一步构建了CIRCpedia数据库,对环形RNA分子中的可变反向剪接(可变环化)和可变剪接进行归类,以便相关研究人员使用。
该数据库界面非常简洁,使用也非常高效方便,是环形RNA研究中非常有用的工具。下面就让我们一起探索一下如何用好这个数据库吧。
1. 打开数据库首页(网址:http://www.picb.ac.cn/rnomics/circpedia/),主界面是一个简单的关于数据库基本情况的介绍,上面是常用的几个工具栏链接,后面我们还要逐一详细介绍。
往下拖动,就能看到一个“Statistics”模块介绍不同组织细胞来源的样品的基本信息。其中包含了19种人类来源的细胞系和19种小鼠来源的细胞系或组织样品。同时也分别介绍了每个样品具体的信息,包括样品的GEO编号(Gene Expression Omnibus,NCBI的一个专门收集高通量测序数据的数据库)、样品基本信息(包括是否为p(A)+,p(A)−,p(A)−/RNase R,以及有没有去除核糖体RNA等),以及具体考察的环形RNA可变剪接形式(A5BS: Alternative 5’ Back-splice Site,A3BS: Alternative 3’ Back-splice Site;CE: Cassette Exon)。
最后,在数据库的首页还简单列举了数据库的主要发展历程和相关参考文献及相关工具的链接。本数据库最早是在2015年12月10日上线的,2016年4月5日公布了环形RNA分析流程CIRCexplorer2 的2.0.0版本,2016年7月22日公布了CIRCexplorer2 的2.1.2版本,2016年7月26日数据库新增加了25个新的样品的信息。
2. 从数据库顶端的工具栏可以链接到“Search”、“Browse”、“Download”、“About”和数据库创建研究组的主页。
3.“Search”链接点击进去后会呈献给大家一个用于搜索的界面:
在该界面中支持针对特定基因和基因组位置进行相关环形RNA的检索。物种条件目前只有人和小鼠两个选项。基因和基因组位置信息可以根据标准的基因命名或hg19/mm10参考基因组序列中的位置信息输入即可进行相关检索。Cell Line条件可以勾选感兴趣的细胞类型,也可以用默认的所有细胞系或组织进行检索。Type条件提供了circRNA、A5BS 、A3BS 、CE四种选项,分别对应于所有环形RNA,5’可变反向剪接,3’可变反向剪接,cassette exon等不同类型可变剪接方式。
以PTEN为例,选择人类所有细胞系中所有环形RNA为条件,检索后报告结果如下。共检索到9条环形RNA的记录,分别列出了circID、Species、Gene、Isoform、Location、RPM、ExonStart-ExonEnd、Seq Type、Cell Line等信息。点击Gene可以直接链接到相应基因所在的Gene Card网页,而点击Location则可以查看当前环形RNA的测序峰图和具体在基因组上的位置分布。
5. 数据库也提供了下载服务,可以进入下载界面,根据物种、细胞类型、可变剪接类型等条件进行数据下载。
总之,CIRCpedia数据库界面非常简洁,适用于初学者和专业环形RNA研究者的不同需求,希望通过本文的讲解能帮助大家更熟练应用这一数据库网站。数据库创建研究组也将持续维护和更新该数据库网站,以进一步助力和推动环形RNA研究的发展。
致谢:本文写作过程得到董瑞博士的鼎力支持和悉心指导,在此表示衷心的感谢!