查看原文
其他

数据可视化 | 配色八项原则

数据Seminar 2022-12-31

源自 | Medium

作者 | Aseem Kashyap

原题 | 8 Rules for optimal use of color in data visualization

编译 | 小蚊子数据分析

转自 | 量化研究方法

题图 | 源自pexels.com

1在应该使用配色的时候使用,而不是在可以使用的时候使用配色

颜色的使用应该仔细斟酌,以传达关键的发现,因此,这一决定不能留给自动算法来做出。

大多数数据应该是中性颜色,如灰色,保留鲜艳的颜色以将注意力引向重要或非典型的数据点。

1991-1996年的销售额(百万美元)

红色被用来引起人们对1995年异常低迷的销售的关注。其他没有明显销售额变化的年份都是灰色的。

2利用颜色对相关数据点进行分组

颜色可用于对相似值的数据点进行分组,并使用以下两个调色面板呈现这种相似性的程度:

顺序调色板由均匀饱和度的单一色调的不同强度组成。相邻颜色的亮度变化对应于它们用于渲染的数据值的变化。

发散调色板是由两个连续的调色板(每个调色板具有不同的色调)相互堆叠而成,中间有一个拐点。

在可视化具有两个不同方向变化的数据时,这种调色板非常有用。

下面左边的图表使用由单一色调(绿色)组成的顺序调色板来表示范围从-0.25到+0.25的值,而右边的图表使用不同色调的调色板来表示正值(蓝色)和负值(红色)。

2010-2019年美国人口的百分比变化

由两个色调(拐点为零)的红色(蓝色)构成的发散配色方案比顺序配色方案更合适。

在右侧的地图中,仅根据颜色就可以立即识别正值和负值。

我们可以立即得出结论,中西部和南部城镇的人口减少了,东部和西岸的人口增加了。

这种对数据的关键洞察在左边的图表中并不是立竿见影的,不能用颜色本身来区分,而是必须使用绿色的强度来阅读地图。

3对不相关的数据使用分类颜色

分类调色板来自不同色调但饱和度和强度相同的颜色,可用于具有完全不同来源或不相关值的不相关数据点的可视化。

顺序和发散调色板应用于通过编码定性值来呈现大小的变化,而分类调色板应用于通过编码量化值来呈现不相关的数据类别。

4对数据项进行归类

虽然使用不同的颜色可以帮助区分不同的数据点,但一张图表最多只能包含6-8个不同的颜色类别,以便每个类别都容易区分。

前15个国家/地区服务的卫星数量

15个国家都使用不同的颜色,使得左边的图表难以阅读,特别是对于卫星较少的国家。

而右边的图表可读性更好,代价是丢失了卫星较少国家的信息,所有这些信息都被归类在“其他”中。

请注意,我们在这里使用了分类配色方案,因为每个国家/地区的数据完全不相关。例如,印度的卫星数量完全独立于法国的卫星数量。

5改变图表类型通常可以减少对颜色的需求

在前面的示例中,饼图可能不是最佳选择。由此造成的类别损失可能并不总是可以接受的。

相反,绘制条形图时,我们可以使用单一颜色并保留所有15个数据类别。

前15个国家/地区服务的卫星

如果可视化中需要6-8种以上的不同颜色(色调),可以合并某些类别或浏览其他图表类型。

6不使用顺序配色方案的场景

为了使顺序调色板的颜色细微差别很明显,这些颜色必须相邻放置,如下图所示。

当像散点图一样彼此分开时,细微的差别就变得很难理解了。

当数据点彼此不紧邻时,很难解释顺序的配色方案,如右侧的散点图所示。这些颜色只能用于可视化相对值,如左图所示。

顺序配色方案的最佳用途是渲染值的相对差异。它不适合绘制使用分类配色方案呈现的绝对值。

7选择合适的背景

物体的感知颜色不仅取决于物体本身的颜色,还取决于其背景。

这导致我们就图表中背景色的使用得出以下结论:按相同颜色分组的不同对象也应具有相同的背景。这通常意味着背景颜色的变化必须最小化。

8不是每个人都能看到所有的颜色

大约10%的世界人口是色盲。

为了让每个人都能获得彩色信息图表,避免使用红色和绿色的组合。

下面显示的是三种不同色盲的人是如何查看同一张地图的。

色盲是如何影响色觉的

9结论

可视化的动力在于讲述数据背后的故事。只有深思熟虑地运用色彩,才能帮助强化数据故事中的关键论点。




星标⭐我们不迷路!
想要文章及时到,文末“在看”少不了!

点击搜索你感兴趣的内容吧


往期推荐


统计计量 | Breiman访谈录:《统计建模:两种文化》20周年纪念

数据资源 | 气候生态类数据资源探索

统计计量 | 选择性偏差与内生性问题是一回事儿吗?

CCAD2021招聘 | 听说这是你想要的另一种生活

软件应用 | Python实现CSV文件的合并与拆分

CCAD2021招聘 | 听说这是你想要的另一种生活

软件应用 | 六种定量方法解决内生性问题(stata代码)






数据Seminar




这里是大数据、分析技术与学术研究的三叉路口


推荐 | 青酱


    欢迎扫描👇二维码添加关注    

点击下方“阅读全文”了解更多

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存