查看原文
其他

数据可视化 | 如何利用色彩来佐证观点

数据Seminar 2022-12-31


来源:环球家电

本文转载自公众号高下制图

在信息设计中色彩为什么如此重要?“数据设计的第一课说的就是色彩是帮助理解数据的工具,” Maureen Stone说道,她是数据可视化企业Tableau的一位色彩专家以及研究经理,“色彩是揭示数据意义的视觉提示,所以我经常告诉设计者们他们要做的第一件事就是指出颜色代表的意义及其功能。”

Stone的工作是与Tableau的信息设计师一起来创造和选择数据可视化的最佳色彩。她在公司的研发部门创立了一个实验室,专门用来研究色彩的专用性以及与数据的关系。后来,他们将研究成果运用到公司最新版的数据可视化软件Tableau 10.0中,设计并加入了调色板选项。

当我在电话中问Stone色彩在数据可视化中会有哪些作用时,她提到了一些常见观点:它是用来区分不同的类别,还是用来赋值,以某种颜色的不同阴影来表示量的多少?也有可能它唯一的作用就是作为背景色来衬托其它分类色。

判断其作用是第一步也是必要的一个步骤,然而这一步之后就会出现更多待定细节,他们对可视化效果都有着深刻影响。Stone介绍说以下是最重要的考量。

由于色度的关系——或者不同色彩维度的度量——不同大小可能导致看到的颜色不同

Part1语义,语义!

Stone说,当针对数据可视化选择颜色的时候,一个需要铭记在心的关键点是一定要保证色彩与其代表的数据能产生的“语义共鸣”。简单来说,设计者们要时刻留心色彩与其用处之间的关系。

举个简单的例子,假设有一个用来比较蔬菜价格的条形图,用绿色代表菠菜,用黄色代表玉米,这与我们对事物和颜色的认知是一致的。若转换颜色——黄色代表菠菜而绿色代表玉米——容易产生混淆。另一个常见的例子来自于热度制图学,比如Trulia制作的交通费时的可视化图形,用红色表示交通较坏的情况,而绿色或者黄色表示较好的情况。同样,上下文语义也非常重要。假如你是在对电脑巨头企业苹果公司的季度收入作图,那么你会用灰色来表示数据,从而与其品牌和产品颜色对应,而不是那些像水果颜色的红红或绿绿。

在热度图中,用红色往往代表较坏的情况,而绿色或者黄色表示较好的情况。——via Trulia

显然,有部分概念并不能和某一颜色产生关联,设计者们可能会将这当做是自由发挥的好机会,但是Stone则将其视为利用数据对文字与色彩的关联进行深度挖掘的时机。在2015年的项目研究中,Stone和Tableau的研究科学家Vidya Setlur利用谷歌的n-gram来计算颜色名称出现的频率,设计了一个能够生成有语义色彩的算法,然后在谷歌图片中检索其代表色。

举个例子,用n-gram方法搜索‘黄色’这个词,会出现与‘出租车’关联的结果。同时,用谷歌图片搜索‘出租车’,会出现各种颜色出租车的图片(比如在纽约的一些新车是石灰绿的),但其中黄色车的频率最高。Stone和Setlur设计了一个算法来对这些图片进行聚类并产生关联最强的颜色,这个时候,就是亮黄色。

即时你没有你自己的语言色彩算法,你也可以自己推断语义概念与颜色之间的关系,毕竟用这个是聪明的做法。

左边的图显示了在色彩空间中的标出的颜色,那些颜色相近的颜色,比如绿色和黄色,在感官上也是相似的。——Tableau

Part2高识别度

当色彩开始逐步被运用于数据科学中,你需要区别对待:为了能在可视化图表中精确地表达信息,不同颜色的差别应该足够明显。Stone用颜色空间或一种可以展示颜色所有范围的模型工具来为数据选择颜色。如果选中的颜色在颜色空间中非常接近——例如,绿色和黄色紧临彼此——它们仍然会让人觉得不易区分。在数据可视化中,最好不要同时用两种感觉类似的颜色。

Stone说道:“我们发现,小尺度面积的颜色往往看起来不够多彩”

关于这个想法的一个实例来自2015信息图中展示的最复杂“生命之树”的数据。在这幅信息图中,成千上万条线代表了地球上已知的生物种类——从最基础的细菌到最复杂的多细胞生物。在一个可对比的小图片中,展现了生命进化的细节。研究人员试图通过不同的颜色进行对比。代表细菌的红色挨着代表多细胞生物的蓝色——在色谱上对比强烈的两种颜色,这样的颜色对比有助于我们明确区分如此大量的数据。

“生命之树”的图表通过运用对比强烈的颜色清晰地表达了大量的数据。来自opentreeoflife.org

Part3尺寸问题

当为数据选择或者适配颜色的时候,Stone认为 “粉刷碎片效应”非常重要。逻辑上,如果你想要用亮黄色的涂料粉刷墙面,粉刷整个房间将比只粉刷一小块看起来明亮很多。类似的,某种颜色在地图上被填充一小块与被填充一大片的效果也是截然不同的。

“小尺度面积的颜色往往看起来不够多彩”Stone如是说。这里的变量是指颜色的色度,或色彩维度的评估。例如,一种电蓝色赛车条纹拥有高色度,而柔和的灰蓝色拥有低色度。当被用在小面积区域时,后者的色度需要被增强才能足够显眼地被区分。当大面积使用电蓝色时,需要稍微降低色度,才不会显得很扎眼。

Part4颜色的影响

颜色可以唤起情感共鸣并不奇怪——例如,蓝色和紫色比黄色使人感觉更愉快。鲜绿色使人感觉积极或欢乐。正如Stone所说,“设计领域的人都知道,颜色会对人产生影响,他们对此有很多案例和使用原则”基于这种认知,“那么,即使是一个条线图,也同样适用吗?”

答案是肯定的,Stone说。与加拿大西蒙菲莎大学研究者合作,Stone组织了一个调研去询问人们对条线图的感觉,比如冷静,欢乐,或消极。他们的研究结果显示:人们为平静的条线图挑选更柔和的颜色,为欢快的条线图挑选更明亮的颜色(高色度)。与此同时,他们为消极的条线图选择深颜色。运用与数据相匹配的颜色来填充图表,能强化信息的表达。

在调色板中为图表填色会引起镇静,也许在功能上数据可视化不一定比颜色差异性或语言关联性更重要。但是,把所有的因素考虑进去将帮助人们更容易地吸收和理解数据,Stone说。设计者或许会认为他们颜色的运用是毫无意义的,但是这会对读者理解数据产生情感方面的影响。看一下这幅关于近些年来世界上大量核武器的信息图。

这张信息图用黄色、黑色和白色表达世界上大量的核武器——这些消极的颜色可以与严肃的主题相匹配。(来自Reddit用户drwtsn)

设计者,Reddit 的用户drwtsn,选择了黄色、黑色和白色——这些颜色通常是消极的——而不是明快的薄荷绿和灰绿蓝色或亮红色或橘红色这些可能使你联想到核战争的颜色。正如Stone通过她的研究展现的,在颜色理论背后的迷人的科学不是乏味无趣的大数据的冰冷数学,而是与艺术和科学相结合,使它既实用又美观。





星标⭐我们不迷路!
想要文章及时到,文末“在看”少不了!

点击搜索你感兴趣的内容吧


往期推荐


统计计量 | 社会经济政策的计量经济学评估——理论与应用

统计计量 | 《计量经济学》中的前沿方法——随机干预试验方法简介

机器学习 | 这 725 个机器学习术语表,太全了!

数据资源 | 数据在哪儿?常用数据库链接

数据治理 | “把大象装进冰箱的第二步”:海量微观数据如何“塞进”数据库?

统计计量 | 发现身边的“美”——那些别处心裁的工具变量

资讯 | 南京审计大学开通企研·中国学术大数据平台试用!







数据Seminar




这里是大数据、分析技术与学术研究的三叉路口


推荐 | 青酱


    欢迎扫描👇二维码添加关注    

点击下方“阅读全文”了解更多

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存