查看原文
其他

看了这个你就会画热图了

2017-09-10 生信大讲堂 生信草堂

生信草堂

将会与更多的优秀微信公众号合作,把最优秀的微信推文呈现给大家,希望可以帮助读者更多的了解生信技术,培养和提高读者的生信分析能力!

号外,号外,号外

你想和生信分析大神做好朋友么?

你想认识更多爱好生信分析的小伙伴么?

你想让自己的生信分析走上快车道么?

那就赶快加入我们的生信交流微信群吧!

正确加入我们的模式是:添加我们的微信Edison686868或者mly-1800为好友,标注“加入生信草堂交流群


生信大讲堂 




生信大讲堂微信公众平台,作为浙江大学农业与生物技术学院作物所研究生第七党支部“生信大讲堂”生物信息系列讲座的重要线上平台,结合学科特色,坚持以“四讲四有”中“讲奉献有作为”作为活动核心价值观,为广大科研工作者提供了学习生物信息学相关学科知识的资源及平台。 

~戳这里生信大讲堂公众号原文,请多关注哦~




1热图绘制--Excel

绘制热图的软件或方法有很多,如Excel、R语言、HemI、Python、MATLAB等,各具特点或优势。Excel最简单,界面操作容易上手,不过功能没有可操作性强的R语言、Python等强大;R、Python、MATLAB有更多参数可根据需要进行设置,效果优于Excel;HemI功能介于Excel和R之间。本期就先介绍使用Excel实现热图绘制。


首先准备好数据集(二维矩阵),试验数据集是对十个样本(SP1-SP10)分别四个处理(CK,T1,T2,T3)得到的效应值。虽然直接观察可以发现最优处理或者品种,但不够直观。将数据绘制成单维的柱形图或箱式图也是一种常见选择,但比较不同处理的效果,就需要忽略同处理样本间差异,即计算样本的平均值和方差,失去了样本特异性等个体特征。热图可以更加直观将数据可视化,同时保留二维数据信息。

数据集内容

1. 选中数据集→开始→条件格式→色阶→其他规则


选择规则类型:一般是基于各自值设置所有单元格格式,也可以根据实际选择对部分数据集设置格式。

格式样式默认双色刻度,即初值和终值各对应一种颜色,介于初值和终值之间的值颜色介于初色和终色之间。可手动设置最高值(数字、百分比)和最低值,也可以选择初值色和终值色。


2.去除数字

想要去除数字不可以直接通过清楚表格内容,因为颜色是根据数值确定的,一旦数字被清除,对应颜色也就没了,因此只能将数字颜色隐藏。

选中数据集,设置单元格格式,数字分类自定义,在类型中输入英文状态下的三个分号,即“;;;”,确定。此时数字值已经被隐藏。


3.调整单元格轮廓线及高宽比

将高、宽设置成适当比例,比如设置成高宽相等。

还是有点奇怪。其他表格填充全白,调整轮廓线。

4.其他格式:

三色刻度+数据条+图标集

不同类型的图标集


2热图绘制--Heatmap Illustrator

HemI功能很单一,就是画热图。

下载地址:

http://hemi.biocuckoo.org/down.php

提供windows/Linux/Mac版

下载完成后,一路next安装好。

1.导入数据

支持导入文件格式有xls(97-2003Excel),csv(逗号分隔),txt(制表符Tab分割),xml(HemI工程文件),常见的是xls格式

LOAD或file→load导入文件。

有多个Sheet的表格一次只能导入一个sheet,选择要导入的sheet。

2.选择数据

一般直接Auto select,X/Y-axistitle打上勾,否则没有坐标轴文字部分。如有空格,默认会变成黑色,如果觉得不好看,设置空格颜色。Finish。

3.生成热图

如上所示。颜色不好看,Set更换颜色。

同Excel的三色刻度和双色刻度,设置初色和终色,或中间色。

设置完成后,点“REFRESH”更新热图。

4.调整坐标轴字体、字号、方向等,画布大小、留白大小,选择需要聚类的列或行

默认数据归一化参数为Linear,对于数值差距比较大的情况,可在option→Statistic设置为log对数参数;

默认聚类方法是Average Linkage,可在option→Statistic换成别的参数。

调整好各项参数后,得到最后的热图。

5.导出热图,file→export image,png,jpg和tiff三种格式,tiff分辨率最高(600dpi)


3热图绘制--R (Pheatmap)

1.在R中安装并加载pheatmap包及其相应的依赖包

2.加载数据

一般文件转换成csv(逗号分隔)或者txt(制表符分隔)格式

2017/8/28

MONDAY

> data<-read.csv(‘heatmap.csv’,header=T)

or

> data<-read.table(‘heatmap.txt’,header=T)

header参数确定数据文件第一行是不是标题。

F表示第一行不是标题,T表示第一行是标题,数据从第二行开始,默认是T。




3.默认参数,绘制热图

> pheatmap(data)

默认参数:

行列聚类(cluster_row=TRUE, cluster_col=TRUE; 设置treeheight_row=0,treeheight_col=0隐藏进化树,或直接不进行聚类cluster_row=FALSE,cluster_col=FALSE);

矩阵不进行标准化(scale=”none”,可设置为“row”“column”标准化);

默认小块之间灰色分隔(border_color=”grey60”,没有border可设置为“none”或其他颜色);

legend显示在右上方(legend=“TRUE”,可设置legend=“FALSE”不显示legend)

4.参数调整,优化热

>pheatmap(x,cellwidth=40,cellheight=40,border_color=NA,cluster_col=FALSE,main="ExampleHeatmap",fontsize=15,treeheight_row=120,cutree_row=3)


参数:

cellwidth和cellheight设置小格长宽

border_color设置边界颜色

main设置热图标题

fontsize设置字体大小

treeheight_row/col设置进化树高度

cutree_row设置将图拆分开几部分


5.收工



学术手拉手

 长按关注生信草堂

长按关注生信大讲堂





您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存