ggtree给你精致妆容
不想说啥了,因为图中其实已经很清楚了。欢迎买书,【我筹划了近10年的书,终于出中文版了!】,加入交流群。图中传达的关键信息就是要会变通,思路打开了,啥不能画?
ggtree不仅仅是系统发育树,只要是树状的层次结构,全部通杀,所以大家都是用得到的。
最近就有人问我pvclust的可视化,非常高兴pvclust的作者也推荐使用ggtree。
这软件我是用过的,这就是我在2011年发表的文章里的图,用的就是pvclust,大家知道我在2010年发表了GOSemSim,可以使用GO来度量基因或蛋白的功能相似性。当年我就提出来,可以通过miRNA的靶基因来度量miRNA的功能相似性。那时候miRNA还是比较火的,我就用这样的简单思路,写了一篇文章,把人的miRNA相似性给算了一遍,聚个类,分个功能家族啥的。然后就有了主编邀稿,学术新人嘛,看到邀稿,异常开心,现在这些邀稿,不5分以上,都直接当spam删了。当时这个Journal of Clinical Bioinformatics是新刊,从图上大家也可以看到我发的是第一卷,但起码是个BMC出版社啊,不是野鸡,我就接受邀请了,屁颠屁颠地搞了一篇文章,然后这个期刊就倒闭了。。。
接受了就要写,我当时想,我算了个人的,再换个老鼠来算,没意思。我换个病毒的,收集感染人的病毒且有编码miRNA的,然后通过预测病毒编码的miRNA在宿主中的靶基因,用的靶基因预测工具是只考虑热力学的(因为这种情况是不适合用进化保守性的预测工具的),预测完之后,病毒的miRNA对应到人的靶基因,那么我就可以用GOSemSim来计算了,通过靶基因集的相似性来度量病毒miRNA的功能相似性。然后就有了图中这个聚类。
这就是我刚硕士毕业的时候,能够独立灌水,就证明了我导的教育还是很可以的。PS:大家不要抱怨找不到地方读博,我当年也一直没人要。
说到这个pvclust,就让我回想起来这件事。针对层次聚类,我专门写了一个包,ggtreeDendro,所以回应到邮件的提问,就是用这个包,啥都支持,干啥都好(感觉像是货拉拉的广告词
然后再回应到开头说的,大家都可以买书学ggtree,因为层次聚类都在用。数据算了相似性聚类了,你的数据还有关联的信息嘛,在聚类树上,要展示解读,用ggtree过于容易,而其它工具,基本没戏,只能画个光秃秃的树。只有ggtree,才能让你的树以精致妆容示人。