其他
visdat包:助你一眼看穿数据结构和缺失值!
点击下方公众号,回复资料分享,收获惊喜
简介
今天介绍一个简单、实用的visdat[1]包,可以将数据的结构以及缺失值(R语言精要-缺失值篇(可跳转))以作图的方式展现,帮助迅速的了解数据的大概情况,尤其是令人头疼的缺失值!
教程
1. 安装和载入R包
install.packages("visdat")
library(visdat)
library(ggplot2) # 使用到里面的一个数据“msleep”library(visdat)
2. 查看数据
首先查看一下数据:
# 直接展示原始数据集
msleep
上述的数据是以tibble(一文读懂dataframe与tibble之间的异同点!(可跳转))的形式保存,含有83行×11列,上述的NA指的是缺失值。这里只显示了数据的前10行,剩余的73行没有显示。
3. 将整体的数据结构和缺失值进行作图
只需一行代码即可获得整体数据结构和缺失值相关图
vis_dat(msleep)
结果非常惊艳!上图将“msleep”的结构完美展示出来:左侧为数据的行数(observations),上方为各个变量名称(列)。并且标注了各个变量的类型,如西瓜红指的是字符型变量(character),而蓝绿色的为数值型变量(numeric),灰色的为缺失值(NA,not available)。
4. 只专注于缺失值的呈现
也是一行搞定:
vis_miss(msleep)
黑色指代缺失值,灰色指代没有缺失值,并且贴心的标注了缺失值的百分比!
注:所以如果你想对数据缺失值进行可视化,只需记住两个函数:
vis_dat()
和vis_miss()
即可。操作非常简单,可以尝试使用到自己的数据集中。
参考资料
visdat: https://github.com/ropensci/visdat
推荐:可以保存以下照片,在b站扫该二维码,或者b站搜索【庄闪闪】观看R可视化系列视频教程。
相关推荐
R可视乎 | 双变量映射地图绘制
R可视乎|克利夫兰点图系列
R可视乎|棒棒糖图