查看原文
其他

一款脑洞大开的表格可视化神器

杜雨 R语言中文社区 2019-04-22


作者简介Introduction

杜雨,EasyCharts团队成员,R语言中文社区专栏作者,兴趣方向为:Excel商务图表,R语言数据可视化,地理信息数据可视化。

个人公众号:数据小魔方(微信ID:datamofang) ,“数据小魔方”创始人。 


精彩集锦·

那些年倒腾的R语言学习笔记,全都在这里了~

点击图片,领取限时优惠

今天跟大家介绍一款任坤大神写的新包——formattable。

这个包的功能很简单,但是却很具创意性,它颠覆了R语言data.frame数据表的呈现方式,允许在表格内自定义视觉化元素,比如对某一列数据进行字号、颜色、背景、以及图形化处理,整体的版式仍然保留表格的样式,但是已经具有了表和图结合的意味。

关于数据框的呈现方式,R语言内目前较好的自定义呈现方式是谢益辉大神的DT包,可以 将静态表格动态化,进行切片、索引、排序操作。

devtools::install_github("renkun-ken/formattable")install.packages("formattable")
library("formattable")
library("DT")

自定义百分比显示格式。

接触过R语言的都知道R中没有数值形式的百分比,只有浮点型,如果要在数据框中自定义某一列为百分比,则需要使用文本拼接函数将其格式化,但是这样格式化之后,该列便会失去数值格式,转换为字符型变量,无法参数数学运算。

但是formattable包通过扩展内部运算逻辑,不仅可以非常方便的将某一浮点型列自定义为百分比,而且保留其数学运算属性。

p <- percent(c(0.1, 0.02, 0.03, 0.12))p[1] 10.00% 2.00%  3.00%  12.00%p + 0.01[1] 11.00% 3.00%  4.00%  13.00%max(p)[1] 12.00%mean(p)[1] 6.75%class(p)[1] "formattable" "numeric"

通过查看其S3类发现,formattable格式继承了numeric属性,因而保留了数学运算能力。

balance <- accounting(c(1000, 500, 200, -150, 0, 1200))balance[1] 1,000.00 500.00   200.00   (150.00) 0.00     1,200.00
balance + 1000

[1] 2,000.00 1,500.00 1,200.00 850.00   1,000.00 2,200.00

以上accounting函数可以将输出向量自定义为会计上使用的数字合适,三维间隔,同时负值加括号。

class(balance)[1] "formattable" "numeric"

其核心实现方式仍然是通过将其底层S3类继承numeric来实现保留数学运算功能。

p <- data.frame(  id = c(1, 2, 3, 4, 5),   name = c("A1", "A2", "B1", "B2", "C1"),  balance = accounting(c(52500, 36150, 25000, 18300, 7600), format = "d"),  growth = percent(c(0.3, 0.3, 0.1, 0.15, 0.15), format = "d"),  ready = formattable(c(TRUE, TRUE, FALSE, FALSE, TRUE), "yes", "no"))p  id name balance growth ready
1  1   A1  52,500    30%   yes
2  2   A2  36,150    30%   yes
3  3   B1  25,000    10%    no
4  4   B2  18,300    15%    no
5  5   C1   7,600    15%   yes

在数据框中这些特性也依然能够保留(这是自然地,因为数据框就是由若干个等长的向量组成的)

但是这仅仅是formattable很基础的功能部分,下面给大家展示它的杀手锏——针对数据框表格的超强自定义可视化能力。

df <- data.frame(  id = 1:10,  name = c("Bob", "Ashley", "James", "David", "Jenny",     "Hans", "Leo", "John", "Emily", "Lee"),   age = c(28, 27, 30, 28, 29, 29, 27, 27, 31, 30),  grade = c("C", "A", "A", "C", "B", "B", "B", "A", "C", "C"),  test1_score = c(8.9, 9.5, 9.6, 8.9, 9.1, 9.3, 9.3, 9.9, 8.5, 8.6),  test2_score = c(9.1, 9.1, 9.2, 9.1, 8.9, 8.5, 9.2, 9.3, 9.1, 8.8),  final_score = c(9, 9.3, 9.4, 9, 9, 8.9, 9.25, 9.6, 8.8, 8.7),  registered = c(TRUE, FALSE, TRUE, FALSE, TRUE, TRUE, TRUE, FALSE, FALSE, FALSE),  stringsAsFactors = FALSE)

以上是使用普通的输出打印出的数据框呈现方式,那么通过formattable函数格式化之后的数据表格又长什么样呢,人让我们拭目以待。

formattable(df,         list(               age = color_tile("white", "orange"),               grade = formatter(
                                 "span",                                   style = x ~ ifelse(x == "A", style(color = "green", font.weight = "bold"), NA)                                  ),              area(col = c(test1_score, test2_score)) ~ normalize_bar("pink", 0.2),              final_score = formatter(
                                 "span",                                  style = x ~ style(color = ifelse(rank(-x) <= 3, "green", "gray")),                                  x ~ sprintf("%.2f (rank: %02d)", x, rank(-x))                                  ),             registered = formatter(
                                 "span",                                   style = x ~ style(color = ifelse(x, "green", "red")),                                   x ~ icontext(ifelse(x, "ok", "remove"), ifelse(x, "Yes", "No"))                                   )             )         )


是不是很神奇呀,仔细观察以上表格中,一共使用了三种自定义可视化类型,分别是字体大小和颜色自定义、字体背景自定义、以及文本自定义。

color_tile函数用于输出按照数值量级进行颜色背景填充的列。

formatter函数提供字体显示格式的自定义,grade列自定义了值为A的记录显示绿色,并将字体加粗,否则忽略。
test1_score, test2_score两列通过area函数在对应字体背景位置使用条形图来代表指标量级大小,颜色填充粉色。
final_score列对指标按照top3显示绿色,其余显示灰色,同时将内容显示格式自定义为浮点型+(rank:名次)进行显示。
registered列则在对填充颜色按照对应布尔值进行显示(TRUE显示绿色、FALSE显示红色)之外,在左侧添加了对用的icon文本(TRUE显示绿色对号,FALSE显示红色叉号)。

是不是很神奇呀,一个小小的包竟然可以做这么有趣的事情,这种表格在财务数据、营销数据或者绩效数据表中是经常会用到的可视化形式,简单明了,非常醒目。

DT::datatable(df)


而DT的datatable函数,则仅仅是通过动态交互的形式提供了一个可交互的表格UI环境。

本项目主页地址:

https://github.com/renkun-ken/formattable


相关课程推荐


体系全面,最具调性!R语言可视化&商务图表实战课程:

点击“阅读原文”开启新姿势

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存