查看原文
其他

R语言聚类分析可视化(2)

阿越就是我 医学和生信笔记 2023-06-15
关注公众号,发送R语言python,可获取资料

医学和生信笔记,专注R语言在临床医学中的使用、R语言数据分析和可视化。主要分享R语言做医学统计学、临床研究设计、meta分析、网络药理学、临床预测模型、机器学习、生物信息学等

💡专注R语言在🩺生物医学中的使用


之前的推文使用默认的plot函数进行聚类树的可视化,详情请点击:R语言聚类分析(1),今天继续扩展聚类树的可视化。

默认的聚类树可视化函数已经非常好用,有非常多的自定义设置,可以轻松实现好看的聚类树可视化。

比如加个背景,更改颜色等:

op <- par(bg = "grey90")

plot(h.clust, main = "层次聚类", sub="", xlab = "",
     col = "#487AA1", col.main = "#45ADA8", col.lab = "#7C8071",
     col.axis = "#F38630", lwd = 2, lty = 1, hang = -1, axes = FALSE)
# add axis
axis(side = 2, at = 0:5, col = "#F38630",
     labels = FALSE, lwd = 2)
# add text in margin
mtext(0:5, side = 2, at = 0:5,
      line = 1, col = "#A38630", las = 2)
plot of chunk unnamed-chunk-8
par(op)

如果对默认的可视化效果不满意,可以先用as.dendrogram()转化一下,再画图可以指定更多细节。

dhc <- as.dendrogram(h.clust)
plot(dhc,type = "triangle"# 比如换个类型
plot of chunk unnamed-chunk-9

可以提取部分树进行查看,使用cut指定某个高度以上或以下的树进行查看。

op <- par(mfrow = c(21))

# 高度在3以上的树
plot(cut(dhc, h = 3)$upper, main = "Upper tree of cut at h=3")

# 高度在3以下的树
plot(cut(dhc, h = 3)$lower[[2]],
     main = "Second branch of lower tree with cut at h=3")
plot of chunk unnamed-chunk-10
par(op)

每一个节点都有不同的属性,比如颜色、形状等,我们可以用函数修改每个节点的属性。

比如修改标签的颜色。

# 按照上面画出来的结果,我们可以分为5类,所以准备好5个颜色
labelColors = c("#CDB380""#036564""#EB6841""#EDC951""#487AA1")

# 把聚类树分为5个类
clusMember <- cutree(h.clust,k=5)

# 给标签增加不同的颜色
colLab <- function(n) {
  if (is.leaf(n)) {
    a <- attributes(n)
    labCol <- labelColors[clusMember[which(names(clusMember) == a$label)]]
    attr(n, "nodePar") <- c(a$nodePar,
                            list(cex=1.5# 节点形状大小
                                 pch=20# 节点形状
                                 col=labCol, # 节点颜色
                                 lab.col=labCol, # 标签颜色
                                 lab.font=2# 标签字体,粗体斜体粗斜体
                                 lab.cex=1 # 标签大小
                                 )
                            )
  }
  n
}

# 把自定义标签颜色应用到聚类树中
diyDendro = dendrapply(dhc, colLab)    

# 画图
plot(diyDendro, main = "DIY Dendrogram")  

# 加图例
legend("topright"
     legend = c("Cluster 1","Cluster 2","Cluster 3","Cluster 4","Cluster 5"), 
     col = c("#CDB380""#036564""#EB6841""#EDC951""#487AA1"), 
     pch = c(20,20,20,20,20), bty = "n", pt.cex = 2, cex = 1 , 
     text.col = "black", horiz = FALSE, inset = c(00.1))
plot of chunk unnamed-chunk-11

如果想要更加精美的聚类分析可视化,可以参考之前的几篇推文:


参考资料

  1. R帮助文档
  2. https://r-graph-gallery.com/31-custom-colors-in-dendrogram.html
  3. https://www.gastonsanchez.com/visually-enforced/how-to/2012/10/0/Dendrograms/




咨询交流等,欢迎加入🐧QQ交流群:613637742




往期推荐



可能是最适合初学者的TCGA官网下载和表达矩阵整理教程

R语言卡方检验方法总结

limma差异分析,谁和谁比很重要吗?

神器oneMark支持自定义主题和代码高亮方案了

R语言画肿瘤领域的瀑布图

ChAMP分析TCGA结直肠癌的甲基化数据!

ChAMP分析甲基化数据:从β值矩阵开始的流程

TCGA官网下载的文件数量竟然和TCGAbiolinks不一致!

增强统计功能的大量开源SPSS统计插件来啦

ChAMP分析甲基化数据:标准流程

TCGAbiolinks的甲基化数据分析

ChAMP分析甲基化数据:样本信息csv的制作和IDAT读取

ggplot2绘制突变全景图

C-statistic的显著性检验

ROC(AUC)曲线的显著性检验

maftools需要的文件如何自己整理

韦恩图/upset plot 合辑

单细胞入门之多样本整合

单细胞入门之细胞类型鉴定

ggplot2画泳道图箭头如何显示

新版TCGA数据库不同癌种的组学数据合并

TCGA的maf突变文件不能下载了?直接用TCGAbiolinks包搞定!

用ggplot2画肿瘤领域常见的泳道图

mlr3的校准曲线也是一样画!

单细胞入门之Seurat标准流程

你一半我一半的gghalves


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存