查看原文
其他

绘制 m6A peak 在 lncRNA 上的分布

JunJunLab 老俊俊的生信笔记 2022-08-15


生死看淡,不服来干

1引言

现在 Guitar 包的最新版本为 2.10,好像只能绘制 noncoding RNA上的 peak 分布,而绘制 lncRNA 上的 peak 分布功能不见了。今天找了一下,发现 1.50 的版本可以,在 githup 上面,以下是 Guitar 这个包发的文章里的图:

文章为: Guitar: An R/Bioconductor Package for Gene Annotation Guided Transcriptomic Analysis of RNA-Related Genomic Features

下面是文章介绍对 lncRNAbins 的原理示意图:

Guitarworkflow:

2安装

bioconductor 安装的是最新版的,我们按照 githup 上面的版本:

devtools::install_github('lzcyzm/Guitar')

3使用

我们使用测试数据:

library(Guitar)

# 加载测试数据
narrowPeak <- system.file(
  "extdata""m6A_hg19_1000peaks_macs2.narrowPeak",
  package="Guitar")

# 转为GRanges格式
m6A_Bcell <- narrowPeaktoGRanges(narrowPeak)

# 分组
m6A_Bcell_1 <- m6A_Bcell[1:300]
m6A_Bcell_2 <- m6A_Bcell[301:600]
m6A_Bcell_3 <- m6A_Bcell[601:900]

# 存放于list中
feature_hg19 <- list(m6A_Bcell_1, m6A_Bcell_2, m6A_Bcell_3)

# 分组命名
names(feature_hg19) <- c("Group_1","Group_2","Group_3")

# 加载注释文件
txdb_file <- system.file("extdata""hg19_toy.sqlite",
                         package="Guitar")
txdb <- loadDb(txdb_file)

# 或者在线获取
# Or use makeTxDbFromUCSC() to download TxDb from internet
# txdb <- makeTxDbFromUCSC(genome="hg19)

# 构建Guitar的坐标
gc_txdb <- makeGuitarCoordsFromTxDb(txdb, noBins=20)
[1"total 1932 transcripts extracted ..."
[1"total 1043 transcripts left after ambiguity filter ..."
[1"total 471 mRNAs left after component length filter ..."
[1"total 148 ncRNAs left after ncRNA length filter ..."
[1"Building Guitar Coordinates. It may take a few minutes ..."
[1"Guitar Coordinates Built ..."

默认绘图:

# 默认绘图
GuitarPlot(gfeatures = feature_hg19,
           GuitarCoordsFromTxDb = gc_txdb)
[1"Using provided Guitar Coordinates"
[1"resolving ambiguious features ..."
[1"no figure saved ..."

使 5UTR,CDS,3UTR 区域相等:

# 不对5utr\cds\3utr 进行scale
GuitarPlot(gfeatures = feature_hg19,
           GuitarCoordsFromTxDb = gc_txdb,
           rescaleComponent=FALSE)
[1"Using provided Guitar Coordinates"
[1"resolving ambiguious features ..."
[1"no figure saved ..."

绘制出上下游区域,改为堆叠型:

# 填充型
GuitarPlot(gfeatures = feature_hg19,
           GuitarCoordsFromTxDb = gc_txdb,
           includeNeighborDNA =TRUE,
           rescaleComponent=FALSE,
           fill=TRUE)
[1"Using provided Guitar Coordinates"
[1"resolving ambiguious features ..."
...

此外还支持其他格式的输入数据,如 bed3,bam 等:

大家可以自己取尝试探索。



欢迎加入生信交流群。加我微信我也拉你进 微信群聊 老俊俊生信交流群 哦,代码已上传至QQ群文件夹,欢迎下载。

群二维码:

老俊俊微信:


知识星球:



所以今天你学习了吗?

欢迎小伙伴留言评论!

今天的分享就到这里了,敬请期待下一篇!

最后欢迎大家分享转发,您的点赞是对我的鼓励肯定

如果觉得对您帮助很大,赏杯快乐水喝喝吧!



 往期回顾 




snakemake 使用多环境分析数据

跟着 Genome Research 学画图: 等高线散点图

基因 hclust 聚类并绘制聚类热图和表达趋势图

设置 wsl 子系统的使用线程和内存

使用 Mfuzz 包聚类分析并自定义绘图

clusterProfiler 的 shiny 版上线了!

听说你想把 spearman 和 pearson 展示在一张相关性热图里?

snakemake 进阶用法

听说你离成功还差个对象?

snakemake 初探

◀...

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存