数据呈现 | R制图:日历热图,杭州空气质量知多少?
日历热图(Calendar Heatmap)是指热力图和日历图两者组合的时序图。其实,它是一种双变量图,由时间变量和另一种变量组成,其具体形式则是由小色块群有序且紧凑地以日历格式组成的图表,每个小色块代表时间变量(一天),而小色块颜色则代表另一种变量,每个小色块都根据另一种变量的值进行颜色编码。其中,另一种变量的类型可以是定类/定序数据,也可以是定比/定距数据。
数据集
一般来说,日历热图描绘的是一些高频时序数据(一天),比如,绘制一年中某图书馆每天接待学生人数,观察某网站全年每天的点击量,等等。下面我们从空气质量在线监测平台(https://www.aqistudy.cn/)获取到2019年浙江杭州空气质量数据,想通过R软件绘制日历热图,来观察当地全年空气质量变化情况。具体数据形式见下表1:
表1 浙江杭州日常空气质量部分指标
注:变量Day指日期,AQI指空气质量指数,PM2.5指直径小于等于2.5微米的颗粒物。
日历热图——calendarHeat
基于2019年杭州每天空气质量变化指标,我们利用R语言中的calendarHeat()函数绘制日历热图:
## 加载包
library(openxlsx)
library(lattice)
library(grid)
library(chron)
## 获取日历图表
source("https://raw.githubusercontent.com/iascchen/VisHealth/master/R/calendarHeat.R")
## 读取数据
air_data<-read.xlsx('air_data.xlsx')
## 设置时间变量
air_data$Day<-as.Date(air_data$Day,"%m/%d/%Y")
## 绘制日历热图
# AQI
calendarHeat(dates=air_data$Day,values = air_data$AQI,
color='r2b',varname='AQI')
# PM2.5
calendarHeat(dates=air_data$Day,values = air_data$PM2.5,
color='g2r',varname='PM2.5')
左右滑动查看更多
图形展示
日历热图绘制并不难,运行上述代码,我们可以绘制如下图表:
图1 杭州AQI日历热图
注:图中红色色块表示AQI>100,颜色越深则空气质量越差;蓝色色块表示AQI<100,颜色越深则空气质量越优。
图2 杭州PM2.5日历热图
几点小结
从杭州AQI日历热图看,杭州空气存在污染的情况近80天,质量较差的月份主要集中在1月、5月、6月、8月和9月,特别是星期五出现污染可能性更大,AQI大于100的天数明显增多。
__________________________________
►一周热文
数据呈现丨R与Office珠联璧合:如何实现R制图便捷导入PPT?
数据Seminar
这里是大数据、分析技术与学术研究的三叉路口
作者:简华(何年华)审阅:杨奇明编辑:青酱
欢迎扫描👇二维码添加关注