这些可视化设计的坑，你踩了吗？

查看原文

其他

这些可视化设计的坑，你踩了吗？

Original 想喝咖啡的课代表澎湃美数课 2021-07-30

收录于话题

#美数课堂

51个

7月17日下午，约40位数据可视化爱好者参加了由美数课组织的活动——“数据可视化吐槽大会”🔗。爱好者们来自媒体、咨询、教育、设计、互联网等多个行业。

⌂ 活动现场

是的，你没有看错，这次活动的主题，就是对数据可视化的设计进行“挑刺💉”和“拍砖🧱”。

我们挑选了一系列国外的可视化作品，供大家吐槽，其中不乏一些大名鼎鼎的获奖作品。当然，在吐槽之余，这次活动也产出了许多干货。比如，哪些是被大家疯狂抨击的“瞎操作”？哪些手法又存在争议、需要三思而后行呢？下面，课代表来带你一探究竟：

✦✧

这些坑绝不能踩

在做可视化设计时，有一些红线是不可以逾越的。否则，可视化将会误导人、欺骗人，或者根本不可读。

1号坑：“谁能告诉我这张图在说什么？”——缺少标题

标题一般是内容的凝练和总结，也是人们首先会关注到的元素。而缺少标题则会使人丧失对图表的整体把握，不知所云。

⌂ 一张没有提供任何背景信息的图

2号坑：“这个数据指的是什么东西？”——缺少图例/图例标注不明

阅读可视化，实际上是一个“编码-解码”的过程。读者则需要通过设计师给予的提示（如图例）去解码数据的意义。下图中，无论是每个圆环中心的数字，还是数字底下的热力图，都完全没有图例，可谓是生动诠释了什么叫“看图全靠蒙”。

⌂ 缺乏图例

3号坑：“我努力了，但我真的分不清”——颜色过于接近

“五彩斑斓的黑”说的可能就是它吧。这么多近似的颜色混杂在一起，只能是让人眼前一黑。

⌂ 颜色过于接近

4号坑：“我可能需要一对火眼金睛”——类别过多/类别过于接近

同时展示太多数据字段，会造成严重的视觉混乱。尤其是如下图这样，大部分类别的取值十分接近、被挤压成一团乱麻时，数据的呈现基本上是无效的。

⌂ 类别过多

5号坑：“这谁能看清？”——可视化尺寸/字体尺寸过小

设计可视化时，需要考虑其在设备上的显示效果。如果尺寸过小，会导致阅读吃力、影响阅读进程。下图是一个在活动中被疯狂吐槽的例子，右边饼图的尺寸着实是太随意了。

⌂ 图表尺寸过小

6号坑：“好险，差点就被骗了”——擅自改变基准线

使用直角坐标系的图表，数值的起始点应该为0，这是一条可视化的基本准则。然而，在涉及政治宣传的可视化中，这条准则却常常被打破。以下图为例，首先，单看每张柱状图，其基准线就被人为抬高了。左边这张图中，红白两个柱子的高度差为162，和柱子的高度（349）不成比例，可见基准线不为0。这样做，是为了让红色柱子显得比较高、和白色柱子的差距小。此外，左右两张柱状图的基准线也不统一。数值为566的柱子，竟然比511矮。这样做，显然也是为了打压对手。

⌂ 被篡改的基准线

7号坑：“基本的数学常识呢？”——数据计算错误

仔细看下图可以发现，饼图的两个扇形之和，加起来不等于100%。同时，占比大的扇形，数值反而小，数值标注也出错了。事实上，我们在使用Excel这样的软件作图时，已经不容易发生这样的错误。但是，当绘图过程中涉及到较多人工排版时（如Adobe illustrator），大家还是要细心再细心。

⌂ 一张迷惑的饼图

8号坑：“何必多此一举？”——同一数据维度，使用了不同的编码

明明是一样的事情，却用不同的视觉元素来表示，此所谓画蛇添足。下图中，绿色的柱子表示印度油价的变化，蓝色的柱子表示国际油价的变化。然而，突然出现一根黄色的柱子和红色的箭头，让人不禁心生疑惑。再仔细看这些或宽或窄的柱子，似乎也毫无意义。此时，恐怕读者的内心就如同图中的这位老者，三分痛苦，三分茫然，四分不知所措。

⌂ 画蛇添足的编码

9号坑：“别图轻松省事”——不同数据维度，使用了相同的编码

下面这张图的问题可能不容易察觉。该图展示了某机构接到网络犯罪的投诉数量（左），和网络犯罪导致的损失金额（右）。这两者本是两个不同的数据维度，但是因为使用了相同的视觉编码，读者会不自觉地对其气泡的大小进行对比，然后……发现其实没有可比性。这种编码手法，不能说完全错误，但却会对人眼造成误导，增加认知成本。

⌂ 误导的编码

以上这些案例和总结，都是参加活动的各位朋友，从WTF Visualizations（https://viz.wtf/）这个可视化翻车案例网站现场搜寻并分析的。不怕辣眼睛的话，读者朋友们也可以光顾这个网站进行可视化避坑训练。

✧✦

这些争议点也要注意

还有一些争议点，可能没有标准答案，但也可以成为可视化精进过程中的考量指标：

视觉上：

争议1：“有必要搞这么复杂吗？”——使用不常见的可视化图表

当读者是大众用户时，需要考虑他们对图表的接受程度。一些比较复杂的图表，虽然可以有效地表现数据，但可能不被大多数人理解。比如，路透社的这篇文章，使用了排序河流图来展示华盛顿历年来最严重的火灾，阅读起来需要一定门槛。

⌂ 使用不太常见的可视化图表

争议2：“有必要搞这么花哨吗？”——过度/无意义的装饰

在可视化领域，“装饰主义”的作品一直饱受争议。一方面，有人觉得它们吸睛、有趣，另一方面，有人觉得它们冗余、幼稚。

比如，下图中，每个emoji代表了美国一个州的画像。其眉毛代表失业率、眼睛代表教育程度、嘴巴代表贫困率，以此类推。

这样的设计，是负担还是吸引呢？

⌂ 多维度数据的象形编码

争议3：“不明觉厉，可惜看不懂”——较为抽象的艺术性表达

一些可视化设计已经偏向艺术层面。比如，下图用类似海（洋）螺（葱）的形状来展现了马克思、恩格斯的书信往来，及他们各自的著作。有小伙伴指出，这张图在审美上让人不明觉厉，但理解成本较高，“明明用柱状图可以画出来的数据，有必要如此抽象吗？”

⌂ 艺术性可视化

争议4：“好有趣，可是看得好累”——“私人定制”的可视化

下图中，作者用花瓣的形状、颜色、数量、大小，来表示暑期电影大片的分级、体裁、网络评分量和平均分。这些编码手法，都是比较私人化的。因此，读者需要不断地回忆花朵的含义，才能读懂数据。当然，从另一方面，它鲜明的个性和趣味性也被很多人喜欢。

⌂ 私人化的视觉编码

争议5：“这么做真的合适吗？”——可视化编码的道德风险

在向读者解释新冠疫情的死亡规模时，华盛顿邮报用了公交车来进行类比，指出一辆公交车大概能装51个人。按照每天死亡3100人来算，大概相当于61辆公交车排在一起。这种类似于“香飘飘一年销量能排地球一圈”的手法，其实可以很好地让读者理解数值。但是，用公交车来装死者，在道德上似乎有些不妥。当然，也有小伙伴指出，对美国这种具有“公路文化”的国家来说，用路来丈量数值，或许是比较正常的。

⌂ 道德上有争议的编码方式

争议6：“看上去似乎是这么回事，可是它严谨吗？”——不严谨的数据编码

这一来自纽约时报的作品，用流动的粒子来表现新冠病例的传播。加上辐射状的铁路网，给人一种密密麻麻的恐惧感。事实上，这些粒子的流动，更多是一种“网页效果”，而并不精确对应着患病数据。但是，在结果上，这种效果却给人一种瘟疫在中国源源不绝的印象。

⌂ 酷炫大于严谨

争议7：“这样的设计是否会放大偏见呢？”——可视化编码的引导性

仍然是刚刚的案例。作者还在一些可视化中使用了大量的红色粒子。这种红色在中国土地大面积大幅铺开的效果，也帮助渲染了一种很恐怖的氛围。有小伙伴建议，对于非死亡病例（尤其是无症状和轻度感染者）其实可以用比较温和的颜色代替，这样，可视化带给人的感觉会完全不一样。

⌂ 是否在渲染“瘟疫”？

争议8：“我体会不到数值的尺度”——不具象的数值

如何帮助人们更好的理解数据的尺度？下图使用了方块面积来呈现火灾规模。但是，这种方法只能比较“哪场火灾更大”，但是“我还是不知道一场火灾到底有多大”。

⌂ 用方块面积表示火灾规模

下图或许是一种更好的方式。作者通过将火灾面积与其他东西（如纽约曼哈顿岛的面积）进行类比，让读者对火灾规模有更具象的体会。

⌂ 将火灾规模与纽约曼哈顿岛对比

交互和前端：

争议9：“我无法掌握阅读的主动权”——是否让用户主导阅读进程

一些争议发生在交互上。比如，在用户进入页面，或者滚动到网页的特定位置时，会触发动画播放。读者需要等待动画播放完毕，才能继续阅读。这种用户失去主动权的状态，有可能引发部分读者的不适。

⌂ 开场自动播放的动画

争议10：“这个作品不符合我的阅读习惯”——是否适合手机移动端

还有小伙伴提到，横版的图片，不适合手机端阅读——“应该多考虑移动互联网时代的需求”。

⌂ 更适合横屏阅读的设计

内容上：

争议11：“我不知道作者想说明什么”——数据细节和解释的缺失

这一争议主要发生在“探索类的可视化”上。这种可视化主要是呈现了一系列数据信息，让读者去自由探索，但没有明确的故事线或者阅读指引。这类可视化“信息很多，可以慢慢看”，但也可能“让我不知道主题是什么，我能学到什么”。

⌂ 一些典型的“探索型可视化”

争议12：“为什么让我猜半天？”——标题、结论等主要信息的滞后

在一些作品中，作者可能为了制造悬疑、增加艺术性等意图，将重要信息放在靠后的位置。但是这可能导致读者在一开始处于“一脸懵”的状态，甚至失去阅读兴趣。

⌂ 读者需要滑动一定的距离才会看见标题

争议13：“我觉得作者在误导我”——由于数据选取造成的偏见

最后一个争议点在于数据的选取。被作者挑选出来的数据变量，不一定能反应事情最真实的一面，甚至可能产生“关联性错觉”。比如，在刚在提到的例子中，作者将马克思、恩格斯的来往信件，及他们各自的著作并列放置，但“作者似乎在暗示马克思的著作一定与恩格斯有关”。

⌂ 点击图片查看大图

再比如，最近被网友疯狂吐槽的一个可视化项目，用航班开放程度、城市封锁程度等来评估各国的“新冠恢复力排名”（covid resilience ranking），结果是美国被排到了第一位。其最被抨击的一个点就在于，抛开疫情的病例数、死亡数去谈“恢复力”，忽略了数据之间的相关性。恢复力高，不等于疫情不严重。恢复力低，也并不等于疫情很严重。如果作者本身就在盲人摸象，又怎么能期待读者买ta的账呢？

⌂ 彭博社对各国进行的“新冠恢复力排名”

但是，吐槽之余，我们也惊喜的发现：到场的可视化爱好者基本对可视化的创新性有着较大的宽容度，比较少会因为一个作品的不完美而否定掉其创新性。

可视化的创新突破，有时难以面面俱到。一个作品，也可能无法做到各方面都完美。

组织这次吐槽大会，课代表是希望可视化这门美妙的艺术，在坚持创新的基础上，仍然能时时回应读者的关切，从而能将创作者的创作激情更彻底的传递到读者心中。

以上就是我们针对“数据可视化吐槽大会”的总结。你最常踩的是哪些坑？还有哪些坑值得补充？欢迎留言告诉我们～

撰稿蓝星宇

◒◡◒

┊推 - 荐 - 阅 - 读┊

”FAN某”的离婚财产分割判决书（全文）

”FAN某”的离婚财产分割判决书（全文）

公益慈善｜“翼行天下一生守护”慈善项目捐赠仪式圆满举行！

何炅突然高调官宣喜讯，网友恭喜：30年了，终于等到这一天！

哈里斯女粉搞4B运动、毒杀丈夫，回旋镖能否让美国“血流成河”