R语言学习笔记之相关性矩阵分析及其可视化

The output of the function rcorr() is a list containing the following elements : - r : the correlation matrix - n : the matrix of the number of observations used in analyzing each pair of variables - P : the p-values corresponding to the significance levels of correlations.

library(Hmisc)#加载包
res2 <- rcorr(as.matrix(mydata))
res2

#可以用res2$r、res2$P来提取相关系数以及显著性p-value
res2$r

res2$P

如何将相关系数以及显著性水平p-value整合进一个矩阵内，可以自定义一个函数flattenCorrMatrix。

# ++++++++++++++++++++++++++++
# flattenCorrMatrix
# ++++++++++++++++++++++++++++
# cormat : matrix of the correlation coefficients
# pmat : matrix of the correlation p-values
flattenCorrMatrix <- function(cormat, pmat) {
ut <- upper.tri(cormat) data.frame( row = rownames(cormat)[row(cormat)[ut]],
column = rownames(cormat)[col(cormat)[ut]], cor =(cormat)[ut], p = pmat[ut] )
}
举个栗子
---
res3 <- rcorr(as.matrix(mtcars[,1:7]))
flattenCorrMatrix(res3$r, res3$P)

可视化相关系数矩阵

有不同的方法来可视化，主要有下面四种：

symnum() function
corrplot() function to plot a correlogram
scatter plots
heatmap

##symnum() function
主要用法：

symnum(x, cutpoints = c(0.3, 0.6, 0.8, 0.9, 0.95), symbols = c(" “,”.“,”,“,”+“,”*“,”B“),
abbr.colnames = TRUE) #很好理解，0-0.3用空格表示， 0.3-0.6用.表示，以此类推。

举个栗子

symnum(res, abbr.colnames = FALSE)#abbr.colnames用来控制列名

##corrplot() function to plot a correlogram
这个函数来自于包corrplot(),通过颜色深浅来显著相关程度。参数主要有：

type: “upper”, “lower”, “full”,显示上三角还是下三角还是全部
order:用什么方法，这里是hclust
tl.col (for text label color) and tl.srt (for text label string rotation) :控制文本颜色以及旋转角度

library(corrplot)#先加载包
corrplot(res, type = "upper", order = "hclust", tl.col = "black", tl.srt = 45)

##也可以结合显著性绘制

# Insignificant correlations are leaved blank
corrplot(res2$r, type="upper", order="hclust", p.mat = res2$P, sig.level = 0.01, insig = "blank")

##Use chart.Correlation(): Draw scatter plots
chart.Correlation()来自于包PerformanceAnalytics

library(PerformanceAnalytics)#加载包
chart.Correlation(mydata, histogram=TRUE, pch=19)

解释一下上图：

对角线上显示的是分布图
左下部显示的是具有拟合线的双变量散点图
右上部显示的是相关系数以及显著性水平

##heatmap()

col<- colorRampPalette(c("blue", "white", "red"))(20)#调用颜色版自定义颜色
heatmap(x = res, col = col, symm = TRUE)#symm表示是否对称

　往期精彩内容整理合集　

2017年R语言发展报告（国内）

R语言中文社区历史文章整理（作者篇）

R语言中文社区历史文章整理（类型篇）

公众号后台回复关键字即可学习
回复 R                  R语言快速入门及数据挖掘
回复 Kaggle案例  Kaggle十大案例精讲（连载中）
回复文本挖掘   手把手教你做文本挖掘
回复可视化   R语言可视化在商务场景中的应用
回复大数据         大数据系列免费视频教程
回复量化投资      张丹教你如何用R语言量化投资
回复用户画像      京东大数据，揭秘用户画像
回复数据挖掘     常用数据挖掘算法原理解释与应用
回复机器学习人工智能系列之机器学习与实践
回复爬虫            R语言爬虫实战案例分享

震撼！上海开放Google、Meta等国际平台，中国数字化迈出历史性一步！

战争烈度再升级，特朗普加征10%对华关税

特朗普称计划对中国商品征收25%的关税，外交部回应

Dior变色唇膏59元两只限量抢！一抹玻璃唇，秒变时尚girl！

林志玲终于晒娃，3岁儿子也太帅气了！网友：有孩子的，都来学学

R语言学习笔记之相关性矩阵分析及其可视化

计算相关系数矩阵

您可能也对以下帖子感兴趣

震撼！上海开放Google、Meta等国际平台，中国数字化迈出历史性一步！

战争烈度再升级，特朗普加征10%对华关税

特朗普称计划对中国商品征收25%的关税，外交部回应

Dior变色唇膏59元两只限量抢！一抹玻璃唇，秒变时尚girl！

林志玲终于晒娃，3岁儿子也太帅气了！网友：有孩子的，都来学学

生成图片，分享到微信朋友圈

R语言学习笔记之相关性矩阵分析及其可视化

计算相关系数矩阵

您可能也对以下帖子感兴趣