查看原文
其他

多个基因集富集结果泡泡图绘制展示

生信宝典 生信宝典 2022-07-05

多个基因集富集结果展示

通常我们会同时对多个基因集分别进行富集分析,结果放在一起展示。这时我们需要在富集结果后面加一列,标记该结果是哪个基因集的富集,在Excel中可以很方便地操作。如下面动图所示,分组的名字自己根据实际取名即可。

有了这个多组基因富集后整合起来的数据,就可以用BIC绘图了。数据粘贴就不展示了,直接看参数选择。

与单组富集结果相比,最大的改动就在:

  • 新增的Group列而非 log_odds_ratio列作为横轴(X-axis)信息

提交后获得结果。图中每个点代表一个富集的条目,在Y轴有对应标记。每一列是一组基因的富集结果。三组共有的富集在最上面,2组共有的富集在中间,每组特有的富集在底部。每个点的大小代表用于分析的基因集中匹配到该通路的基因数目,颜色代表富集程度。

如果希望在显示多组时,依然保留log_odds_ratio的信息,也可以。这里换一套数据更好展示(因为Group2、Group3是模拟数据,直接从Group1中抽取出来的,所以绘制出来会存在重叠)

GOID Ontology Term Level q m t k log_odds_ratio p Group
GO:0006730 biological_process one-carbon metabolic process 4 340 57 45240 13378 1.012309306 0.001481151 Group1
GO:0007154 biological_process cell communication 2 2169 6843 45240 13378 0.100137585 0.007326261 Group1
GO:0007165 biological_process signal transduction 5 1955 6136 45240 13378 0.107606604 0.006325629 Group1
GO:0023052 biological_process signaling 1 2100 6613 45240 13378 0.102820905 0.006590727 Group1
GO:0044700 biological_process single organism signaling 2 2100 6613 45240 13378 0.102820905 0.006590727 Group1
GO:0050896 biological_process response to stimulus 1 3251 10438 45240 13378 0.074846633 0.012472089 Group1
GO:0006730 biological_process one-carbon metabolic process 4 340 57 45240 13378 1.212309306 0.001481151 Group2
GO:0007154 biological_process cell communication 2 2169 6843 45240 13378 0.200137585 0.007326261 Group2
GO:0007165 biological_process signal transduction 5 1955 6136 45240 13378 0.207606604 0.006325629 Group2
GO:0023052 biological_process signaling 1 2100 6613 45240 13378 0.302820905 0.006590727 Group2
GO:0007165 biological_process signal transduction 5 1955 6136 45240 13378 0.307606604 0.006325629 Group3
GO:0023052 biological_process signaling 1 2100 6613 45240 13378 0.202820905 0.006590727 Group3
  • log_odds_ratio列依然作为横轴(X-axis)信息

  • 新增的Group列作为Shape variable,用不同的形状表示不同的组

  • Shape variable order是可选项,调节组的顺序,默认不填写或按需设置都可

  • 修改下颜色,用colorPicker设置,前面工具有介绍

提交后获得结果。图中每个点代表一个富集的条目,在Y轴有对应标记。这些条目按其log_odds_ratio的值排序后展示,log_odds_ratio高的条目在Y轴上方展示;每个点的大小代表用于分析的基因集中匹配到该通路的基因数目,颜色代表富集程度。点的形状则代表其所属的组信息。

但是这个图出现了一个问题,图例显示不全。最简单的解决办法就是把图的宽度和高度调大。

结果就正常了,可以下载PDF版、PPT版(如果选了参数)和对应的R代码

往期精品(点击图片直达文字对应教程)

机器学习

后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存