在数据可视化中,颜色可以随便使用吗?
分享:肖一
在这篇文章正式开始之前,先跟大家说明一下这期文章的用意:
说实话,我做数据可视化还未超过一年,很多东西自己都还在慢慢摸索。
但通过之前做的一些数据作品,确实感受到很多小伙伴都对数据可视化有很浓厚的兴趣,我也时常收到一些关于如何做可视化的私信。
所以不管我目前可视化的能力有多薄弱和不足,我也打算尝试把我自己一些小小的经验体会分享给大家,让更多人参与到数据可视化的生产中来,至少我会觉得这是一件有意义的事。
我把这个全新的栏目命名为「肖一数说的菜鸟级可视化分享」,因为我的经验是真的很初级,我也尽量把它表达得通俗易懂,让大家能够更容易上手操作。
每期的选题来源或是一些我自己看到的有趣的可视化现象,或是一些读者来询的可视化问题,所以大家如果有什么关于数据可视化的想法,可以随时给我留言或私信,我们一起交流分享~
话不多说,马上进入「肖一数说的菜鸟级可视化分享」第一弹吧:
昨天微信收到一小伙伴私信,询问我一张图是怎么做的。
我点开看了看,一共两张图:一张是词云图,一张是一个组合图。
词云图就不必说了,非常常规,很多网站都可以轻松实现。
但另一张图乍一看是挺好看,但细看就有些问题了:
图源:某高校毕业生就业质量报告
问题出在最显眼的左上角部分,我把它单拎出来说:
这是一个扇形的组合图,但要说出它都包含了什么图表类型,有点难,因为它不太规范。
综合来看,其问题有二:
Q1:文字大小的设定标准何在?
首先是右下角分布的一些「中央新闻单位」,分别对应了毕业生就业数量,文字做了大小处理,从“中国妇女报”到“中央广播电视总台”由小变大。
按照这个逻辑,文字大小与就业数量呈正相关。
但从图中我们可以看到,70位毕业生选择的“新华社”与25位毕业生选择的“人民日报社”在文字大小上是相等的。
所以这里就有些迷惑了,此处设定文字大小的意义何在呢?按照新闻单位的知名度来排序的吗?
好像也并没有一个对所有中央新闻单位排名的标准......
Q2:颜色渐变只是为了美观吗?
这个问题更为明显,因为整张图片最亮眼的地方就是此处的色彩分布。
我们可以看到这部分展示了“毕业生在省级主流媒体就业情况”,一共统计到了31个省、自治区和直辖市。
数据分布是从“澳门”到“北京”由小到大,呈环状分布,在每个数据旁,都设置了一个对应的icon(图标)。
这些icon也是根据数据大小,呈环状分布,并且在填充颜色上,设置为了由浅到深的渐变,因此,颜色渐变和数据大小也可以说是呈正相关的。
但我们可以看到,有485位毕业生就业的“北京”和有69位毕业生就业的“广东”的icon色差极小,肉眼几乎不可辨。
所以这里就要打上一个问号了,此处设置颜色渐变的目的是什么?是为了好看吗?
如果是,那在整张图较大、数据标签又较小的情况下,醒目的颜色变化是会干扰判断的。
也就是说,如果不放大查看数据,一眼看过去,“北京”、“广州”以及“江苏”等地的毕业生就业数量几乎相等,这就失去了可视化的意义。
因此,此处的icon要么就设置成统一的颜色,要么根据数据量的大小设置颜色深浅程度,如下图所示:
P1就不讨论了,非常简单,但是P2的颜色变化该如何实现呢?
所以在这里,肖一就以前两天做的一张运用了同样逻辑的图为大家演示:如何用颜色深浅程度来表示数据量的大小。
这张图的主要部分是根据“2021年1月1日-3月15日北京市空气质量指数(AQI)”的变化情况,数据量的大小与两处地方有关:一是面积的大小,二是颜色的深浅。
从图中可以看到,北京市在3月15日这天图形面积最大,颜色也是最深,这样就可以更直观地感受到北京这天的天气异常状况。
接下来,肖一就为大家演示这张图是如何做出来的~
方法其实有很多,为了方便大家快速上手,这里就介绍运用的软件是最基础的、可操作性最强的一种。
由于我写得较细,所以拆分成3个部分讲解:
Step1:
在EXCEL中打开准备好的数据(在公众号后台发送关键词“AQI”即可获取示例数据),选择“插入图表”。
Step2:
选择插入“二维面积图”。
Step3:
为了使得到的面积图在视觉上更具有冲击力,也方便后面插入其它的图表,我们在这里调转一下X轴和Y轴,让整个面积图倒过来。
Step4:
接下来,我们更改面积图的颜色,由于我们这次的主题是沙尘暴,所以我设定了一个接近这个天气的颜色:深棕色(#7F6000)。
Step5:
为了便于后面操作,我们把面积图的背景和边的颜色都设为透明底。
Step6:
最后选中做好的面积图区域,导出PDF格式备用。(注:记得要先在“页面布局”里把“页面设置”调整为“1:1”,这样可以保证不管你的图有多大,导出PDF后它都会显示在一页里)
Step1:
在EXCEL中选中AQI指数的数据栏。
Step2:
点击“条件格式”,选择“新建规则”里的“双色刻度”。
Step3:
然后设置二级颜色,为了满足可视化需要,我把最低值的颜色设置为了白色(#FFFFFF),最高值的颜色依然设置为了深棕色(#7F6000)。
Step4:
然后就可以看到每一个数据栏都根据数据量的大小填充好了颜色,颜色深浅表示数据大小。为了方便后面操作,现在尽量把数据条拉长一点。
Step5:
同样地,我们导出做好的数据栏区域为PDF格式。
Step6:
然后在任意处理图片的软件里把图片顺时针旋转90度,裁剪掉带数字的部分即可。(此处肖一以PS为例)
Step1:
在PS中同时打开备用的热力图和面积图,然后先选中热力图并复制。
Step2:
同样地,这一步选中面积图。
Step3:
接下来点击顶部操作栏“编辑”一项,选择“选择性粘贴”中的“贴入”,将复制好的热力图贴进面积图里。
Step4:
然后再改变一下热力图的大小,直到其可以完全覆盖面积图即可,这样我们就大功告成啦!
以上就是本期菜鸟级可视化分享的全部内容啦,再次提示:示例数据在后台发送关键词「AQI」即可领取。
赶紧试试吧,如果成功了,记得给肖一反馈!
此外,这是我第一次做可视化经验分享,有很多不足的地方,大家有什么更好的建议可以在留言区评论,我争取改善。
最后,关于数据可视化,大家还发现了什么有趣的现象,或者还有什么想学习的,留言告诉我吧,下期分享我们再来交流~
END
—往期精选—
杂谈
| Tik Tok之死 | 杨丽萍争议 | B站《后浪》|
| N号房调查报道 | 霉霉侃爷录音曝光 | 詹青云被骂 |
| 2020学界动态 | 高考作弊案件 | 乘风破浪的姐姐 |
策划
| 蒙牛伊利传闻 |
喜欢就点个在看吧,现在还可以点赞哦