查看原文
其他

最靠谱的富集分析,超炫的展示方式,TCGA也是他的粉丝【老客户福利】

2017-07-14 小哈 嘉因生物

文末有福利!


小伙伴儿看题目就猜到了

没错,小哈也是那个拽的不要不要的Y叔的粉丝。


上次发帖说不懂生信,不装Linux,也能Run代码—Windows系统的Linux命令行工具Babun(此处有链接,点击查看),公开代码的国际项目之一就是著名的TCGA:

TCGA Workflow: Analyze cancer genomics and epigenomics data using Bioconductor packages [version 2; referees: 1 approved, 2 approved with reservations]

发表在那个遍地是牛的F1000Research上。


打开全文一看,不得了,一共20幅图,其中3幅是用Y叔的ChIPseeker画的,占15%,原来TCGA里藏了Y叔的粉丝!!!


TCGA用clusterProfiler转换了注释ID

TCGA用ChIPseeker画了这3幅图




审稿人圈儿里力推的最靠谱富集分析工具——clusterProfiler

居然也是Y叔写的!

拜服!


它能画出这种图

为啥说它做富集分析最靠谱呢?


1. 算法最靠谱。

看哪个通路是否富集,需要卡P值,P值的计算是关键。


clusterProfiler做富集分析用的是基于差异基因列表的超几何分布,同时支持GSEA这种全表达谱分析的算法。

详见Y叔对比帖:

Comparison of clusterProfiler and GSEA-P


用超几何分布算法计算P值需要基因注释信息、候选基因列表和背景基因列表。

通俗的讲,如果参与某一通路的基因在候选基因(差异表达基因)列表里占的比例很大,而在背景基因(整个基因组)列表中占的比例很小,那么这个通路在候选基因列表中就是富集的。这两个比例相差越多,P值越低。


clusterProfiler用基因组中有注释的基因做背景基因列表;

有的工具用基因组上所有的基因做背景,无注释的基因也算在内。

详见Y叔吐槽帖:

why clusterProfiler fails


如果追求低P值,觉得P值很低很低才好看,那就用后者;

如果追求真理,就用clusterProfiler;

审稿人追求哪种呢?


2. 注释最全,注释最新。

最全。clusterProfiler支持GO、KEGG、MSigDB、DAVID、DOSE, meshes,ReactomePA,还支持用户自己的注释数据。


怪不得TCGA用clusterProfiler来转换注释ID呢!


引用Y叔公众号里的一个例子:

GO注释

KEGG注释


最新。2012年开始,KEGG对数据库下载收费,大量的工具使用的都是2012年以前的数据。所幸KEGG的在线检索一直是免费的,clusterProfiler使用的是在线检索http得到的最新数据。

掐指一算,clusterProfiler得到的富集分析结果领先同行整整五年

让我们追忆一下五年来通路中的研究进展。。。


3. 展示方式最符合生物人的逻辑分析习惯。

小哈最喜欢下面这种展示方式,各种treatment,上调的、下调的基因富集在哪些通路上,富集程度如何,对比,一目了然。

而且他用了红配蓝,为什么高分文章喜欢红配蓝(此处有链接)


4. 这是个活包。

Y叔积极的更新,不断添加新功能,跟用户互动,他还有个公众号,为提高我天朝人民的科研水平做出了杰出的贡献。。。






上海的小伙伴儿已经知道嘉因的结题报告升级到V2版本啦!

告别朴素审美,替换成炫炫的展示方式,帮您把进展报告、Poster、Paper打扮的让人眼前一亮,更新范围里就有这史上最靠谱的富集分析图。




【福利】来啦!

跟嘉因生物有过合作的小伙伴儿

想要升级自己的结题报告吗?


转发本文到朋友圈

截图

长按下图,识别图中二维码,加嘉因小二为好友

发朋友圈截图给嘉因小二

他联系您免费升级结题报告事宜




其他测评

RNA测序分析,哪家公司适合我

ChIP实验,这家公司做的怎么样?有图有真相


点击阅读原文直达Y叔公众号

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存