查看原文
其他

数据呈现 | R制图:日历热图,杭州空气质量知多少?

h简华 数据Seminar 2021-06-03





日历热图(Calendar Heatmap)是指热力图和日历图两者组合的时序图。其实,它是一种双变量图,由时间变量和另一种变量组成,其具体形式则是由小色块群有序且紧凑地以日历格式组成的图表,每个小色块代表时间变量(一天),而小色块颜色则代表另一种变量,每个小色块都根据另一种变量的值进行颜色编码。其中,另一种变量的类型可以是定类/定序数据,也可以是定比/定距数据。




数据集


一般来说,日历热图描绘的是一些高频时序数据(一天),比如,绘制一年中某图书馆每天接待学生人数,观察某网站全年每天的点击量,等等。下面我们从空气质量在线监测平台(https://www.aqistudy.cn/)获取到2019年浙江杭州空气质量数据,想通过R软件绘制日历热图,来观察当地全年空气质量变化情况。具体数据形式见下表1:

表1 浙江杭州日常空气质量部分指标

注:变量Day指日期,AQI指空气质量指数,PM2.5指直径小于等于2.5微米的颗粒物。



日历热图——calendarHeat


基于2019年杭州每天空气质量变化指标,我们利用R语言中的calendarHeat()函数绘制日历热图:

## 加载包library(openxlsx)library(lattice)library(grid)library(chron)
## 获取日历图表source("https://raw.githubusercontent.com/iascchen/VisHealth/master/R/calendarHeat.R")
## 读取数据air_data<-read.xlsx('air_data.xlsx')
## 设置时间变量air_data$Day<-as.Date(air_data$Day,"%m/%d/%Y")
## 绘制日历热图# AQIcalendarHeat(dates=air_data$Day,values = air_data$AQI, color='r2b',varname='AQI')# PM2.5calendarHeat(dates=air_data$Day,values = air_data$PM2.5, color='g2r',varname='PM2.5')

左右滑动查看更多



图形展示


日历热图绘制并不难,运行上述代码,我们可以绘制如下图表:

图1 杭州AQI日历热图

注:图中红色色块表示AQI>100,颜色越深则空气质量越差;蓝色色块表示AQI<100,颜色越深则空气质量越优。

图2 杭州PM2.5日历热图



几点小结


从杭州AQI日历热图看,杭州空气存在污染的情况近80天,质量较差的月份主要集中在1月、5月、6月、8月和9月,特别是星期五出现污染可能性更大,AQI大于100的天数明显增多。

从杭州PM2.5日历热图看,杭州PM2.5浓度与空气AQI分布并不完全一致,PM2.5浓度比较高的在1月份和12月份,而6-9月PM2.5十分良好,出现这种原因可能是,6-9月天气最为炎热,自驾出行的汽车大幅减少,建筑工地户外开工时间可能缩短,加上洒水车更频繁地施水,PM2.5会明显得到改善。

__________________________________

注:点击阅读原文,获取2019年杭州市空气质量指数数据集









►一周热文

数据呈现丨R与Office珠联璧合:如何实现R制图便捷导入PPT?

机器学习丨机器学习与统计学、计量经济学的区别与联系

统计计量丨一文读懂Stata做格兰杰因果检验命令总结

统计计量丨交互项模型的发现,究竟可信吗?

老姚专栏丨可决系数R方的阴暗面

元旦特刊 | 2020年元旦夜演:用R玩烟花,用心写代码

统计计量丨面板数据主要分析方法汇总









数据Seminar




这里是大数据、分析技术与学术研究的三叉路口




作者:简华(何年华)审阅:杨奇明编辑:青酱






    欢迎扫描👇二维码添加关注    


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存