查看原文
其他

在数据可视化中,颜色可以随便使用吗?

肖一凉介 肖一凉介 2022-03-19

分享:肖一

编辑:肖一

在这篇文章正式开始之前,先跟大家说明一下这期文章的用意:

说实话,我做数据可视化还未超过一年,很多东西自己都还在慢慢摸索。

但通过之前做的一些数据作品,确实感受到很多小伙伴都对数据可视化有很浓厚的兴趣,我也时常收到一些关于如何做可视化的私信。

所以不管我目前可视化的能力有多薄弱和不足,我也打算尝试把我自己一些小小的经验体会分享给大家,让更多人参与到数据可视化的生产中来,至少我会觉得这是一件有意义的事。

我把这个全新的栏目命名为「肖一数说的菜鸟级可视化分享」,因为我的经验是真的很初级,我也尽量把它表达得通俗易懂,让大家能够更容易上手操作。

每期的选题来源或是一些我自己看到的有趣的可视化现象,或是一些读者来询的可视化问题,所以大家如果有什么关于数据可视化的想法,可以随时给我留言或私信,我们一起交流分享~

话不多说,马上进入「肖一数说的菜鸟级可视化分享」第一弹吧:

昨天微信收到一小伙伴私信,询问我一张图是怎么做的。

我点开看了看,一共两张图:一张是词云图,一张是一个组合图。

词云图就不必说了,非常常规,很多网站都可以轻松实现。

但另一张图乍一看是挺好看,但细看就有些问题了:

图源:某高校毕业生就业质量报告

问题出在最显眼的左上角部分,我把它单拎出来说:

这是一个扇形的组合图,但要说出它都包含了什么图表类型,有点难,因为它不太规范。

综合来看,其问题有二:

Q1:文字大小的设定标准何在?

首先是右下角分布的一些「中央新闻单位」,分别对应了毕业生就业数量,文字做了大小处理,从“中国妇女报”到“中央广播电视总台”由小变大。

按照这个逻辑,文字大小与就业数量呈正相关

但从图中我们可以看到,70位毕业生选择的“新华社”与25位毕业生选择的“人民日报社”在文字大小上是相等的。

所以这里就有些迷惑了,此处设定文字大小的意义何在呢?按照新闻单位的知名度来排序的吗?

好像也并没有一个对所有中央新闻单位排名的标准......

Q2:颜色渐变只是为了美观吗?

这个问题更为明显,因为整张图片最亮眼的地方就是此处的色彩分布。

我们可以看到这部分展示了“毕业生在省级主流媒体就业情况”,一共统计到了31个省、自治区和直辖市。

数据分布是从“澳门”到“北京”由小到大,呈环状分布,在每个数据旁,都设置了一个对应的icon(图标)。

这些icon也是根据数据大小,呈环状分布,并且在填充颜色上,设置为了由浅到深的渐变,因此,颜色渐变和数据大小也可以说是呈正相关的

但我们可以看到,有485位毕业生就业的“北京”和有69位毕业生就业的“广东”的icon色差极小,肉眼几乎不可辨。

所以这里就要打上一个问号了,此处设置颜色渐变的目的是什么?是为了好看吗?

如果是,那在整张图较大、数据标签又较小的情况下,醒目的颜色变化是会干扰判断的

也就是说,如果不放大查看数据,一眼看过去,“北京”、“广州”以及“江苏”等地的毕业生就业数量几乎相等,这就失去了可视化的意义。

因此,此处的icon要么就设置成统一的颜色,要么根据数据量的大小设置颜色深浅程,如下图所示:

P1就不讨论了,非常简单,但是P2的颜色变化该如何实现呢?

所以在这里,肖一就以前两天做的一张运用了同样逻辑的图为大家演示:如何用颜色深浅程度来表示数据量的大小

这张图的主要部分是根据“2021年1月1日-3月15日北京市空气质量指数(AQI)”的变化情况,数据量的大小与两处地方有关:一是面积的大小,二是颜色的深浅

从图中可以看到,北京市在3月15日这天图形面积最大,颜色也是最深,这样就可以更直观地感受到北京这天的天气异常状况。

接下来,肖一就为大家演示这张图是如何做出来的~

方法其实有很多,为了方便大家快速上手,这里就介绍运用的软件是最基础的、可操作性最强的一种。

由于我写得较细,所以拆分成3个部分讲解:



Step1:

在EXCEL中打开准备好的数据(在公众号后台发送关键词“AQI”即可获取示例数据),选择“插入图表”。

Step2:

选择插入“二维面积图”。

Step3:

为了使得到的面积图在视觉上更具有冲击力,也方便后面插入其它的图表,我们在这里调转一下X轴和Y轴,让整个面积图倒过来。

Step4:

接下来,我们更改面积图的颜色,由于我们这次的主题是沙尘暴,所以我设定了一个接近这个天气的颜色:深棕色(#7F6000)。

Step5:

为了便于后面操作,我们把面积图的背景和边的颜色都设为透明底。

Step6:

最后选中做好的面积图区域,导出PDF格式备用。(注:记得要先在“页面布局”里把“页面设置”调整为“1:1”,这样可以保证不管你的图有多大,导出PDF后它都会显示在一页里)


Step1:

在EXCEL中选中AQI指数的数据栏。

Step2:

点击“条件格式”,选择“新建规则”里的“双色刻度”。

Step3:

然后设置二级颜色,为了满足可视化需要,我把最低值的颜色设置为了白色(#FFFFFF),最高值的颜色依然设置为了深棕色(#7F6000)。

Step4:

然后就可以看到每一个数据栏都根据数据量的大小填充好了颜色,颜色深浅表示数据大小。为了方便后面操作,现在尽量把数据条拉长一点。

Step5:

同样地,我们导出做好的数据栏区域为PDF格式。

Step6:

然后在任意处理图片的软件里把图片顺时针旋转90度,裁剪掉带数字的部分即可。(此处肖一以PS为例)




Step1:

在PS中同时打开备用的热力图和面积图,然后先选中热力图并复制。

Step2:

同样地,这一步选中面积图。

Step3:

接下来点击顶部操作栏“编辑”一项,选择“选择性粘贴”中的“贴入”,将复制好的热力图贴进面积图里。

Step4:

然后再改变一下热力图的大小,直到其可以完全覆盖面积图即可,这样我们就大功告成啦!

以上就是本期菜鸟级可视化分享的全部内容啦,再次提示:示例数据在后台发送关键词「AQI」即可领取。

赶紧试试吧,如果成功了,记得给肖一反馈!

此外,这是我第一次做可视化经验分享,有很多不足的地方,大家有什么更好的建议可以在留言区评论,我争取改善。

最后,关于数据可视化,大家还发现了什么有趣的现象,或者还有什么想学习的,留言告诉我吧,下期分享我们再来交流~


END


—添加星标—

—往期精选—


杂谈

| Tik Tok之死 | 杨丽萍争议 | B站《后浪》

| 罗志祥性丑闻  | 青春有你2 | 罗永浩直播 | 

| N号房调查报道 | 霉霉侃爷录音曝光 | 詹青云被骂 | 

干货
| 研究报告撰写 | 大选头版 | 信息茧房 |
| 新闻业趋势 | 中传20教改 | 
| 诗词话新传 | 英语方法经 | 专业课经验贴 | 
19爆文复盘 | 娱乐向短视频 |
数说
| 国家社科基金 | 数据新闻指南  | 网络舆情 |
| 研究生自杀 | 最美逆行者 | 新冠肺炎 |

| 2020学界动态 | 高考作弊案件 | 乘风破浪的姐姐 

策划

| 阳刚之气 | 考研故事 | 特朗普败选 |

| 疫情下的毕业生 | 考研回忆录 | 

寻真

蒙牛伊利传闻 |


喜欢就点个在看吧,现在还可以点赞哦

 

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存