查看原文
其他

CIRCexplorer3: 对 circRNA 进行相对定量

JunJunLab 老俊俊的生信笔记 2022-08-15

点击上方关注“公众号”

1介绍

今天分享一篇还是由 陈玲玲杨力 团队在 2019 年发表在 GPBGenomics, Proteomics & Bioinformatics)上的文章,提出了一种新的算法来对 circRNA 进行相对定量,CIRCexplorer2 升级为 CIRCexplorer3

线性 RNA 定量的 FPKMfragments per kilobase of transcript per million mapped fragments)和 circRNA 定量的 FPMfragments per million mapped fragments),这两种前者是标准化的,后者没有。两者之间是无法相互比较的。作者提出了一种新的算法 FPBfragments per billion mapped bases)来对 线性 RNAcircRNA 进行定量,通过 FPBcirc/FPBlinear 的比值来得出一个 CIRCscore,这个值就代表了 circRNA 的相对表达水平。

随后作者在不同的数据集和细胞系,RT-QPCR,相关性分析等实验来验证这种方法的准确性和优点。

2摘要:

外显子反向剪接产生的环状 RNA (circRNAs)序列除了反向剪接连接(BSJ)位点外,与从相同基因位点转录的同源线性 RNA 序列完全重叠。因此,从 RNA-seq 数据集中检测整体 circRNA 表达通常依赖于跨越 BSJ 位点的 RNA-seq 片段的检测,这与通过映射到整个基因体的标准化 RNA-seq 片段定量线性 RNA 表达不同。因此,在全基因组范围内直接比较同一基因座的环状和线性 RNA 表达仍然具有挑战性 。在这里,我们将先前报道的 CIRCexplorer pipeline 更新为版本 3,用于从 ribosomal-RNA depleted RNA-seqCIRCexplorer3-CLEAR)进行环状和线性 RNA 表达分析。

3结果

1、CLEAR pipeline 的开发

作者使用 HISAT2 软件对 RNA-seq 数据进行比对,对于线性 RNA 的 reads 比对到 SJ sites,而没有比对上的 reads 则使用 TopHat-Fusion 比对到 BSJ sites,最好两种分别计算 FPB 值,最后计算比值获得 CIRCscore 值:

对于线性 RNA 的多个转录本,作者选取了比对到 SJ sites 最多的 作为后续分析,同时验证了这种方法选取出来的和总的 FPKM 的相关性很高,基本可以代表该基因的 FPKM 值:

2、将 FPB 与 FPKM 进行线性 RNA 定量的比较

高度相关,RT-qpcr 结果类似。

3、FPB 与 FPM 的环状 RNA 定量比较

高度相关,RT-qpcr 结果类似。

此外作者发现 FPB 对于不同的 测序长度测序策略(单双端测序模式) 具有较好的稳定性,而 FPKM 受到影响较大:

4、用 CIRCscore 评价相对环状 RNA 的表达

作者使用 CIRCscore 用 RT-qpcr 验证,结果很高的相关性证明使用 CIRCscore 来使用其线性 RNA 作为背景,进而评估 circRNA 的相对表达丰度是可靠的:

此外作者还使用了其它定量工具来计算 CIRCscore,发现 CLEAR 更简单,更加准确,CIRCexplorer2MapSplice 也是两个可靠的 circRNA 分析工具:

CLEAR 需要更少的资源,一句命令完成分析:

更少的命令:

作者还使用了不同的注释文件测试,发现鉴定到的 circRNA 大部分重叠:

5、circRNA 分析中 FPB 和 CIRCscore 的比较

circRNA 通常与其同源的线性 RNA 共表达,且 circRNA 序列与线性 rna 序列基本重叠。因此,利用 CIRCscore 进行定量的优势 circRNA 的表达是指它将以线性 RNA 的表达为背景来标准化。

有些 circRNA 有较高的 FPB 值,但是 CIRCscore 比较低,是因为它的同源线性 RNA 的表达较高引起的,然而也有较高的 FPB 值的 CIRCscore 也高,表明来自不同基因组位点的环状及其同源线性 RNA 的表达模式不同。

作者还在人 12 种不同组织鉴定了 circRNA 的 FPB 和 CIRCscore,发现环状 RNA 在大脑样本中比在非脑组织中更为丰富:

5、circRNA 能够减小个体差异性

与 FPB 不同的是,使用 CIRCscore 来评估 circRNA 的表达可以减少由 RNA-seq 样本本身引起的个体差异:

很多没有显著性的,通过 CIRCscore 来检验会检验出显著性差异:

FPB:

CIRCscore:

  • 最后作者推荐使用 ribo- RNA-seq 的数据进行分析更为准确。
  • CIRCexplorer3-CLEAR pipeline 及其应用程序在:https://github.com/YangLab/CLEAR。

4南京的晚霞


E N D


欢迎加入生信交流群。加我微信我也拉你进 微信群聊 老俊俊生信交流群 哦.

群二维码:



老俊俊微信:




知识星球:



所以今天你学习了吗?

欢迎小伙伴留言评论!

今天的分享就到这里了,敬请期待下一篇!

最后欢迎大家分享转发,您的点赞是对我的鼓励肯定

如果觉得对您帮助很大,赏杯快乐水喝喝吧!




 往期回顾 




circRNA-seq:CIRCexplorer2 使用指南(二)

circRNA-seq:CIRCexplorer2 使用指南(一)

手把手教你用在线 pheatmap 绘制热图

IGV 导入本地基因组及注释文件

关于 scale 函数和 pheatmap 的图例问题

Circular RNAs 的生物发生、功能和挑战

@你需要提高一下 R 技能了(plyr 包)

ggplot 图例(你想要的都在这了!)

把 corrplot 颜色条改成文献里那样?

ggcor 的环形热图

◀...

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存