新方案 | circRNA数据分析都做些啥(一)?
作为非编码RNA领域新的重量级选手,circRNA数据分析内容与大家熟悉的miRNA,lncRNA分析又有啥异同呢?小编这就带大家先睹为快!
在完成circRNA测序,获取高质量测序数据后,联川会为大家提供丰富的分析内容,主要包括:
1.circRNA鉴定
2.circRNA注释
3.circRNA表达水平分析
4.circRNA功能富集分析
5.circRNA起源分析
6.circRNA-miRNA互作网络分析
1.circRNA鉴定
外显子驱动环化或内含子驱动环化RNA含有一个反向剪接点,并且发生剪接的两个片段来自同一条染色体(见图1)。由于外显子下游的剪接供体连接到外显子上游的剪接受体上,因此外显子的次序发生了重排。根据以上特征鉴定出候选的含有反向剪接点的可能来自环状 RNA 的读段(Back-spliced junctions reads)。因此,不同于线性RNA序列比对基因组的方法,我们采用TopHat-Fusion(以非共线性方式进行比对)进行circRNA数据的比对分析。
图1 circRNA与linear RNA具有不同的序列比对策略
根据circRNA 结构特征以及剪接序列特征,并结合权威文献,设置circRNA鉴定标准,最后获取的鉴定结果(部分)如下表所示。
2.circRNA注释
基于circRNA在基因组中的位置关系以及与protein coding gene的关系,对筛选获得的circRNA candidate进行注释,主要包括:1) circRNA位置关系分类;2) circRNA功能注释,根据circRNA-hosting基因进行功能注释。
2.1 circRNA基因组位置注释
依据在基因组中对应的位置关系进行circRNA分类注释,主要分为5类,即introniccircRNA、exonic circRNA、antisensecircRNA、sense-overlapping circRNA以及intergenic circRNA(见图2)。
图2 circRNA基因组位置分类
2.2 circRNA功能注释
基于circRNA形成机制,依据circRNA对应的circRNA-hosting基因功能进行circRNA功能注释,包括基因注释、GO注释以及KEGG注释。具体内容如下表所示。