看了这个你就会画热图了
绘制热图的软件或方法有很多,如Excel、R语言、HemI、Python、MATLAB等,各具特点或优势。Excel最简单,界面操作容易上手,不过功能没有可操作性强的R语言、Python等强大;R、Python、MATLAB有更多参数可根据需要进行设置,效果优于Excel;HemI功能介于Excel和R之间。本期就先介绍使用Excel实现热图绘制。
首先准备好数据集(二维矩阵),试验数据集是对十个样本(SP1-SP10)分别四个处理(CK,T1,T2,T3)得到的效应值。虽然直接观察可以发现最优处理或者品种,但不够直观。将数据绘制成单维的柱形图或箱式图也是一种常见选择,但比较不同处理的效果,就需要忽略同处理样本间差异,即计算样本的平均值和方差,失去了样本特异性等个体特征。热图可以更加直观将数据可视化,同时保留二维数据信息。
数据集内容
1. 选中数据集→开始→条件格式→色阶→其他规则
选择规则类型:一般是基于各自值设置所有单元格格式,也可以根据实际选择对部分数据集设置格式。
格式样式默认双色刻度,即初值和终值各对应一种颜色,介于初值和终值之间的值颜色介于初色和终色之间。可手动设置最高值(数字、百分比)和最低值,也可以选择初值色和终值色。
2.去除数字
想要去除数字不可以直接通过清楚表格内容,因为颜色是根据数值确定的,一旦数字被清除,对应颜色也就没了,因此只能将数字颜色隐藏。
选中数据集,设置单元格格式,数字分类自定义,在类型中输入英文状态下的三个分号,即“;;;”,确定。此时数字值已经被隐藏。
3.调整单元格轮廓线及高宽比
将高、宽设置成适当比例,比如设置成高宽相等。
还是有点奇怪。其他表格填充全白,调整轮廓线。
4.其他格式:
三色刻度+数据条+图标集
不同类型的图标集
HemI功能很单一,就是画热图。
下载地址:
http://hemi.biocuckoo.org/down.php
提供windows/Linux/Mac版
下载完成后,一路next安装好。
1.导入数据
支持导入文件格式有xls(97-2003Excel),csv(逗号分隔),txt(制表符Tab分割),xml(HemI工程文件),常见的是xls格式。
LOAD或file→load导入文件。
有多个Sheet的表格一次只能导入一个sheet,选择要导入的sheet。
2.选择数据
一般直接Auto select,X/Y-axistitle打上勾,否则没有坐标轴文字部分。如有空格,默认会变成黑色,如果觉得不好看,设置空格颜色。Finish。
3.生成热图
如上所示。颜色不好看,Set更换颜色。
同Excel的三色刻度和双色刻度,设置初色和终色,或中间色。
设置完成后,点“REFRESH”更新热图。
4.调整坐标轴字体、字号、方向等,画布大小、留白大小,选择需要聚类的列或行。
默认数据归一化参数为Linear,对于数值差距比较大的情况,可在option→Statistic设置为log对数参数;
默认聚类方法是Average Linkage,可在option→Statistic换成别的参数。
调整好各项参数后,得到最后的热图。
5.导出热图,file→export image,png,jpg和tiff三种格式,tiff分辨率最高(600dpi)
1.在R中安装并加载pheatmap包及其相应的依赖包。
2.加载数据
一般文件转换成csv(逗号分隔)或者txt(制表符分隔)格式
2017/8/28
MONDAY
> data<-read.csv(‘heatmap.csv’,header=T)
or
> data<-read.table(‘heatmap.txt’,header=T)
header参数确定数据文件第一行是不是标题。
F表示第一行不是标题,T表示第一行是标题,数据从第二行开始,默认是T。
3.默认参数,绘制热图
> pheatmap(data)
默认参数:
行列聚类(cluster_row=TRUE, cluster_col=TRUE; 设置treeheight_row=0,treeheight_col=0隐藏进化树,或直接不进行聚类cluster_row=FALSE,cluster_col=FALSE);
矩阵不进行标准化(scale=”none”,可设置为“row”“column”标准化);
默认小块之间灰色分隔(border_color=”grey60”,没有border可设置为“none”或其他颜色);
legend显示在右上方(legend=“TRUE”,可设置legend=“FALSE”不显示legend)
4.参数调整,优化热图
>pheatmap(x,cellwidth=40,cellheight=40,border_color=NA,cluster_col=FALSE,main="ExampleHeatmap",fontsize=15,treeheight_row=120,cutree_row=3)
参数:
cellwidth和cellheight设置小格长宽
border_color设置边界颜色
main设置热图标题
fontsize设置字体大小
treeheight_row/col设置进化树高度
cutree_row设置将图拆分开几部分
5.收工
学术手拉手
长按关注生信大讲堂