查看原文
其他

珍藏|最简单的热图绘制工具+最全热图绘制工具

BioMan 2022-07-09

热图很重要,真的,这个大家都知道,这个不仅仅在计算表达量聚类的时候用得到,在评估测序数据质量的时候同样用得到,哪怕你在分析股票之间的关系的时候,也会用的热图。

但是

当我觅尽江湖,竟然没有发现一款绿色环保无污染,高端大气上档次的免费的热图绘制工具。

于是乎,小编就 ji ji ge 开发了一款图形化的热图绘制神器。

江湖规矩

先放下载链接,再放教程。

http://gap.shengxin.ren/tool/3/

或点击阅读原文直通

一本正经的教程讲解



1、首次登陆时,会提示注册邮箱,之后会生成一个文件,如下,以后可以将此文件复制到各个小程序的根目录下,就无需再注册啦!


2、双击运行主程序“HeatmapCluster.exe”,打开界面如下:

3、点击右侧“选择矩阵文件”(这里的矩阵文件为表达矩阵,对于行和列,无特殊要求,怎么开心怎么来)。这里,我们举例说明,矩阵文件如下所示(列名为sample200例,行名为gene11个):

4、瞬间生成Heatmap如下(具体运行时间根据您的电脑配置):

5、上面这个图很难看,并且很多参数需要调整,因此更改参数的选项如下:

6、更改颜色,点击这三个颜色框,可以随意选择颜色,这里举例说明选择蓝--红,三种颜色。

7、是否进行cluster?则选择“RowCluster”或者“ColCluster”。

8、是否进行Z-score?则选择按照Row还是Col进行Z变换,例子中,我们按照Row进行Z变换。

9、是否显示Row名字或者Col名字?则选择Show按钮。

10、选择聚类的方式?有“欧氏距离”和“皮尔森相关系数”两个选项。

11、调整完参数后,生成如下:

12、点击右侧保存相关按钮,建议保存为PDF格式,“绘图”按钮其实就是“刷新”功能啦!

13、最终保存的图像为下图(蓝--红):

【来自生信人的忠实粉丝分享_杭州薛之谦】


another其他工具:


1.小白不用R照样画热图

MeV可以应用于芯片数据及NGS数据分析。其单机版下载地址:

https://sourceforge.net/projects/mev-tm4/

同时他也具有在线版本供大家使用:

http://www.tm4.org/#/welcome

下面小编说一下单机版画热图过程


(1)选择数据格式:数据格式可以为为txt格式,具体内容如下图。就是一个基因在不同样本中的表达值了。



(2)软件运行。下载完毕解压后,点击下面的最后一个文件TEMV.bat文件,打开程序。

结果出现如下程序中间运行界面



最终主程序打开了




(2)数据导入:选择“File—>Load Data”,弹出“Expression File Loader”窗口。如下:


点击“Browse”按钮,打开你的表达量数据文件,出现如下界面:



(3)点击load后就出现下面热图了



(4)设置聚类参数:单击MeV主界面“Clustering”按钮,选择层次聚类(Hierarchical Clustering)。出现下面界面,选择相应参数(可以默认),单击“OK”按钮。




(5)展开窗口左侧的“HCL(1)”结点,点击层次聚类树(HCL tree)可查看不同基因表达谱及其聚类的信息。


聚类结果


(5)此外此软件还可以做差异表达分析,具体功能在Statistics中。

2. 热图太丑怎么办?

在基因的表达模式分析中,我们往往需要对多个基因表达数据进行可视化处理,使得我们所关注的基因在不同样本中表达情况一目了然。在日常研究中,我们往往习惯于选择热图实现这一基因表达模式可视化的需求,进而直观的表述我们的基因表达模式的分析结果。

今天就介绍一下非常简易使用的一个绘图包pheatmap

写在前面,准备一个表达谱矩阵,横轴为100个基因,纵轴为208个样本,如下:

首先安装pheatmap

source("http://biocoundctor.org/biocLite.R")
biocLite("pheatmap")

然后加载

library(pheatmap)

最简单的调用如下:

pheatmap(profile)

长这个鬼样子简直没法看,从右侧可以看出数据跨度很大从0-200以上,图中大部分蓝色显示其实大部分值应该是在0-50这个区间,所以我们调整策略,取log(x+1)

pheatmap(log2(profile+1))

比之前好看了点,但是还是有好多黄色,但是很明显看得出来聚类效果比之前好多了,但是很明显最小值太小以至于几乎看不到蓝色,颜色区分不开,进一步的来调整一下区间

bk = unique(c(seq(-5,5, length=100)))
pheatmap(log2(profile+1),breaks = bk)

此时看起来还不错,但是这个颜色有点不舒服,换个颜色试试

bk = unique(c(seq(-5,5, length=100)))
pheatmap(log2(profile+1),breaks = bk
         ,color = colorRampPalette(c("navy", "white", "firebrick3"))(100))

看起来还行,但是从图中可以看到那个中间那条一长条全是白色,事实上我想看看一个基因在不同样本中的高低,所以我应该使用纵轴的zscore进行标准化一下

bk = unique(c(seq(-5,5, length=100)))
pheatmap(log2(profile+1),breaks = bk,scale = 'column'
         ,color = colorRampPalette(c("navy", "white", "firebrick3"))(100))

从图中可以看到有些基因在不同的样本中表达趋势比较一致的情况了,此时纵轴样本一团糊没什么意义,先把他去掉

bk = unique(c(seq(-5,5, length=100)))
pheatmap(log2(profile+1),breaks = bk,scale = 'column',show_rownames = F
         ,color = colorRampPalette(c("navy", "white", "firebrick3"))(100))

bk = unique(c(seq(-5,5, length=100)))
clust=pheatmap(log2(profile+1),breaks = bk,scale = 'column'
         ,show_rownames = F
         ,color = colorRampPalette(c("navy", "white", "firebrick3"))(100))
annotation_col = data.frame(
  ClassGene = factor(paste0('Cluster',cutree(clust$tree_col,10)))
)
rownames(annotation_col) = colnames(profile)
pheatmap(log2(profile+1),breaks = bk,scale = 'column'
         ,show_rownames = F
         ,annotation_col = annotation_col
         ,color = colorRampPalette(c("navy", "white", "firebrick3"))(100))

就写到这吧,还没有涉及的参数:

clustering_distance_rows = "correlation"#表示行聚类使用皮尔森相关系数聚类,当然也可以自定义如drows = dist(test, method = "minkowski");clustering_distance_rows = drows

cluster_row = FALSE#表示行不聚类

legend = FALSE#表示右侧图例不显示

display_numbers = TRUE#表示在热图中格子显示对应的数字,在那种横纵轴数目比较小是时候可用,比如样本间相关系数聚类

number_format = "\%.1e"#当显示数字时数字的显示方式

cellwidth = 15, cellheight = 12#表示热图中小方格的宽度和高度

fontsize = 8#表示热图中字体显示的大小

filename = "test.pdf"#表示直接就保存成test.pdf图片了

labels_row#可以自己定义横轴的显示字符,默认上图是基因名

main#类似title啦

gaps_col#产生一个间隔,就像有些文章中的那种分类后每个分类都有一个间隔。


3.本地绘制热图

绘制好看的热图(pheatmap

 

pheatmap全称为pretty heamap;

pheatmap(mat, color = colorRampPalette(rev(brewer.pal(n = 7, name =

  "RdYlBu")))(100), kmeans_k = NA, breaks = NA, border_color = "grey60",

  cellwidth = NA, cellheight = NA, scale = "none", cluster_rows = TRUE,

  cluster_cols = TRUE, clustering_distance_rows = "euclidean",

  clustering_distance_cols = "euclidean", clustering_method = "complete",

  clustering_callback = identity2, cutree_rows = NA, cutree_cols = NA,

  treeheight_row = ifelse(cluster_rows, 50, 0),

  treeheight_col = ifelse(cluster_cols, 50, 0), legend = TRUE,

  legend_breaks = NA, legend_labels = NA, annotation_row = NA,

  annotation_col = NA, annotation = NA, annotation_colors = NA,

  annotation_legend = TRUE, drop_levels = TRUE, show_rownames = T,

  show_colnames = T, main = NA, fontsize = 10, fontsize_row = fontsize,

  fontsize_col = fontsize, display_numbers = F, number_format = "%.2f",

  number_color = "grey30", fontsize_number = 0.8 * fontsize,

  gaps_row = NULL, gaps_col = NULL, labels_row = NULL,

  labels_col = NULL, filename = NA, width = NA, height = NA,

  silent = FALSE, ...)


参数较多,但是直接用默认参数就能产生比较好看的热图了;下面以例子的形式给出pheatmap的一些重要参数的用法:

#首先构建一个矩阵用于测试:

test = matrix(rnorm(200), 20, 10)

test[1:10, seq(1, 10, 2)] = test[1:10, seq(1, 10, 2)] + 3

test[11:20, seq(2, 10, 2)] = test[11:20, seq(2, 10, 2)] + 2

test[15:20, seq(2, 10, 2)] = test[15:20, seq(2, 10, 2)] + 4

colnames(test) = paste("Test", 1:10, sep = "")

rownames(test) = paste("Gene", 1:20, sep = "")

#test为20行10列的矩阵:

 

#采取默认参数直接出图


library(pheatmap)

pheatmap(test)


#默认参数下是对行列均进行聚类(可设置cluster_row = FALSE, cluster_col = FALSE不进行行列的聚类;如果进行聚类了,还可以通过设置treeheight_row=0, treeheight_col=0显示dendrogram),矩阵没有进行标准化(标准化参数为scale可选"none""row""column"),热图的每个小块之间以灰色隔开(参数border_color,如果不想要border可以设置为NA,当然也可以设置成其它颜色),legend显示在右上方(可设置legend = FALSE不显示legend);热图的颜色可利用参数color调整;

 


 

#可自由设置legend的标签


pheatmap(test, cluster_row = FALSE, legend_breaks = -1:4, legend_labels = c("0",

"1e-4", "1e-3", "1e-2", "1e-1", "1"))


#在legend上的-1~4位置显示"0", "1e-4", "1e-3", "1e-2", "1e-1", "1"

 

 

#可设置参数display_numbers数值显示在热图的格子中,可通过number_format设置数值的格式,较常用的有"%.2f"(保留小数点后两位)"%.1e"(科学计数法显示,保留小数点后一位)number_color设置显示内容的颜色:

pheatmap(test, display_numbers = TRUE, number_format = "%.2f", number_color="purple") #"%.2f"表示保留小数点后两位

 

pheatmap(test, display_numbers = TRUE, number_format = "%.1e") #"%.1e"表示以科学计数法表示,保留小数点后一位

 

#还可以自己设定要显示的内容;

pheatmap(test, display_numbers = matrix(ifelse(test > 5, "*", ""), nrow(test)))

 

 


#pheatmap还提供了参数设置每个格子的大小

pheatmap(test, cellwidth = 15, cellheight = 12, main = "Example heatmap"fontsize = 8, filename = "test.pdf") #main可设置热图的标题,fontsize设置字体大小,filename可直接将热图存出,支持格式png, pdf, tiff, bmp, jpeg,并且可以通过widthheight设置图片的大小;

 

 


#pheatmap还可以显示行列的分组信息,支持多种分组;

annotation_col = data.frame(CellType = factor(rep(c("CT1", "CT2"), 5)), Time = 1:5)

rownames(annotation_col) = paste("Test", 1:10, sep = "")

 

annotation_row = data.frame(GeneClass = factor(rep(c("Path1", "Path2", "Path3"), c(10, 4, 6))))

rownames(annotation_row) = paste("Gene", 1:20, sep = "")

 

pheatmap(test, annotation_col = annotation_col, annotation_row = annotation_row)

 

#还可以自己设定各个分组的颜色

ann_colors = list(Time = c("white", "firebrick"), #连续数值型分组可设置成渐变

    CellType = c(CT1 = "#1B9E77", CT2 = "#D95F02"),

    GeneClass = c(Path1 = "#7570B3", Path2 = "#E7298A", Path3 = "#66A61E"))

pheatmap(test, annotation_col = annotation_col, annotation_row = annotation_row,

         annotation_colors = ann_colors)

 

 


#pheatmap还能够根据特定的条件将热图分隔开

# cutree_rowscutree_cols:根据行列的聚类数将热图分隔开;

pheatmap(test,cutree_rows=3,cutree_cols=2)

 

#还可以利用gaps_rowgaps_col自己设定要分隔开的位置

pheatmap(test, annotation_col = annotation_col, cluster_rows = FALSE, gaps_row = c(10, 14),

         cutree_col = 2)

 

 


#可以设置labels_rowlabels_col自己设定或列的标签

labels_row = c("", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "Il10", "Il15", "Il1b")

 pheatmap(test, annotation_col = annotation_col, labels_row = labels_row)

科研工具/资料:

 Sci-Hub永久链接,最优链接

② Graphpad最全作图教程

无代码派如何绘制高颜值的图片?

无限制访问Google学术

科研软件、生信书籍应有尽有......

科研进展、热点资讯,穿梭科研内外

①  BMJ:多喝全脂牛奶,或可降低高血压、糖尿病及代谢综合征的患病风险

谈到科研论文打假,这两位可是高手啊

③  世界上最mini的博士论文究竟是1页还是13页?

期刊解读、生信

全基因组关联分析(GWAS) — 群体结构

这本期刊5分+,对国人友好,命中率还不错!


BioMan

BioMan主要报道生命科学领域热点资讯、解读前沿进展、分享科研资料。我们组建了10余个交流群,欢迎大家进群交流。添加公众号博主微信:mBioMan(下方二维码),邀你进群。温馨提示:添加管理员时,请备注一下研究方向+单位/学校!


在看,也是一种习惯↓

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存