这些可视化设计的坑,你踩了吗?
7月17日下午,约40位数据可视化爱好者参加了由美数课组织的活动——“数据可视化吐槽大会”🔗。爱好者们来自媒体、咨询、教育、设计、互联网等多个行业。
是的,你没有看错,这次活动的主题,就是对数据可视化的设计进行“挑刺💉”和“拍砖🧱”。
我们挑选了一系列国外的可视化作品,供大家吐槽,其中不乏一些大名鼎鼎的获奖作品。当然,在吐槽之余,这次活动也产出了许多干货。比如,哪些是被大家疯狂抨击的“瞎操作”?哪些手法又存在争议、需要三思而后行呢?下面,课代表来带你一探究竟:
✦✧
这些坑绝不能踩
在做可视化设计时,有一些红线是不可以逾越的。否则,可视化将会误导人、欺骗人,或者根本不可读。
1号坑:“谁能告诉我这张图在说什么?”——缺少标题
标题一般是内容的凝练和总结,也是人们首先会关注到的元素。而缺少标题则会使人丧失对图表的整体把握,不知所云。
2号坑:“这个数据指的是什么东西?”——缺少图例/图例标注不明
阅读可视化,实际上是一个“编码-解码”的过程。读者则需要通过设计师给予的提示(如图例)去解码数据的意义。下图中,无论是每个圆环中心的数字,还是数字底下的热力图,都完全没有图例,可谓是生动诠释了什么叫“看图全靠蒙”。
3号坑:“我努力了,但我真的分不清”——颜色过于接近
“五彩斑斓的黑”说的可能就是它吧。这么多近似的颜色混杂在一起,只能是让人眼前一黑。
4号坑:“我可能需要一对火眼金睛”——类别过多/类别过于接近
同时展示太多数据字段,会造成严重的视觉混乱。尤其是如下图这样,大部分类别的取值十分接近、被挤压成一团乱麻时,数据的呈现基本上是无效的。
5号坑:“这谁能看清?”——可视化尺寸/字体尺寸过小
设计可视化时,需要考虑其在设备上的显示效果。如果尺寸过小,会导致阅读吃力、影响阅读进程。下图是一个在活动中被疯狂吐槽的例子,右边饼图的尺寸着实是太随意了。
6号坑:“好险,差点就被骗了”——擅自改变基准线
使用直角坐标系的图表,数值的起始点应该为0,这是一条可视化的基本准则。然而,在涉及政治宣传的可视化中,这条准则却常常被打破。以下图为例,首先,单看每张柱状图,其基准线就被人为抬高了。左边这张图中,红白两个柱子的高度差为162,和柱子的高度(349)不成比例,可见基准线不为0。这样做,是为了让红色柱子显得比较高、和白色柱子的差距小。此外,左右两张柱状图的基准线也不统一。数值为566的柱子,竟然比511矮。这样做,显然也是为了打压对手。
7号坑:“基本的数学常识呢?”——数据计算错误
仔细看下图可以发现,饼图的两个扇形之和,加起来不等于100%。同时,占比大的扇形,数值反而小,数值标注也出错了。事实上,我们在使用Excel这样的软件作图时,已经不容易发生这样的错误。但是,当绘图过程中涉及到较多人工排版时(如Adobe illustrator),大家还是要细心再细心。
8号坑:“何必多此一举?”——同一数据维度,使用了不同的编码
明明是一样的事情,却用不同的视觉元素来表示,此所谓画蛇添足。下图中,绿色的柱子表示印度油价的变化,蓝色的柱子表示国际油价的变化。然而,突然出现一根黄色的柱子和红色的箭头,让人不禁心生疑惑。再仔细看这些或宽或窄的柱子,似乎也毫无意义。此时,恐怕读者的内心就如同图中的这位老者,三分痛苦,三分茫然,四分不知所措。
9号坑:“别图轻松省事”——不同数据维度,使用了相同的编码
下面这张图的问题可能不容易察觉。该图展示了某机构接到网络犯罪的投诉数量(左),和网络犯罪导致的损失金额(右)。这两者本是两个不同的数据维度,但是因为使用了相同的视觉编码,读者会不自觉地对其气泡的大小进行对比,然后……发现其实没有可比性。这种编码手法,不能说完全错误,但却会对人眼造成误导,增加认知成本。
✧✦
这些争议点也要注意
还有一些争议点,可能没有标准答案,但也可以成为可视化精进过程中的考量指标:
视觉上:
争议1:“有必要搞这么复杂吗?”——使用不常见的可视化图表
当读者是大众用户时,需要考虑他们对图表的接受程度。一些比较复杂的图表,虽然可以有效地表现数据,但可能不被大多数人理解。比如,路透社的这篇文章,使用了排序河流图来展示华盛顿历年来最严重的火灾,阅读起来需要一定门槛。
争议2:“有必要搞这么花哨吗?”——过度/无意义的装饰
在可视化领域,“装饰主义”的作品一直饱受争议。一方面,有人觉得它们吸睛、有趣,另一方面,有人觉得它们冗余、幼稚。
比如,下图中,每个emoji代表了美国一个州的画像。其眉毛代表失业率、眼睛代表教育程度、嘴巴代表贫困率,以此类推。
这样的设计,是负担还是吸引呢?
争议3:“不明觉厉,可惜看不懂”——较为抽象的艺术性表达
一些可视化设计已经偏向艺术层面。比如,下图用类似海(洋)螺(葱)的形状来展现了马克思、恩格斯的书信往来,及他们各自的著作。有小伙伴指出,这张图在审美上让人不明觉厉,但理解成本较高,“明明用柱状图可以画出来的数据,有必要如此抽象吗?”
争议4:“好有趣,可是看得好累”——“私人定制”的可视化
下图中,作者用花瓣的形状、颜色、数量、大小,来表示暑期电影大片的分级、体裁、网络评分量和平均分。这些编码手法,都是比较私人化的。因此,读者需要不断地回忆花朵的含义,才能读懂数据。当然,从另一方面,它鲜明的个性和趣味性也被很多人喜欢。
争议5:“这么做真的合适吗?”——可视化编码的道德风险
在向读者解释新冠疫情的死亡规模时,华盛顿邮报用了公交车来进行类比,指出一辆公交车大概能装51个人。按照每天死亡3100人来算,大概相当于61辆公交车排在一起。这种类似于“香飘飘一年销量能排地球一圈”的手法,其实可以很好地让读者理解数值。但是,用公交车来装死者,在道德上似乎有些不妥。当然,也有小伙伴指出,对美国这种具有“公路文化”的国家来说,用路来丈量数值,或许是比较正常的。
争议6:“看上去似乎是这么回事,可是它严谨吗?”——不严谨的数据编码
这一来自纽约时报的作品,用流动的粒子来表现新冠病例的传播。加上辐射状的铁路网,给人一种密密麻麻的恐惧感。事实上,这些粒子的流动,更多是一种“网页效果”,而并不精确对应着患病数据。但是,在结果上,这种效果却给人一种瘟疫在中国源源不绝的印象。
争议7:“这样的设计是否会放大偏见呢?”——可视化编码的引导性
仍然是刚刚的案例。作者还在一些可视化中使用了大量的红色粒子。这种红色在中国土地大面积大幅铺开的效果,也帮助渲染了一种很恐怖的氛围。有小伙伴建议,对于非死亡病例(尤其是无症状和轻度感染者)其实可以用比较温和的颜色代替,这样,可视化带给人的感觉会完全不一样。
争议8:“我体会不到数值的尺度”——不具象的数值
如何帮助人们更好的理解数据的尺度?下图使用了方块面积来呈现火灾规模。但是,这种方法只能比较“哪场火灾更大”,但是“我还是不知道一场火灾到底有多大”。
下图或许是一种更好的方式。作者通过将火灾面积与其他东西(如纽约曼哈顿岛的面积)进行类比,让读者对火灾规模有更具象的体会。
交互和前端:
争议9:“我无法掌握阅读的主动权”——是否让用户主导阅读进程
一些争议发生在交互上。比如,在用户进入页面,或者滚动到网页的特定位置时,会触发动画播放。读者需要等待动画播放完毕,才能继续阅读。这种用户失去主动权的状态,有可能引发部分读者的不适。
争议10:“这个作品不符合我的阅读习惯”——是否适合手机移动端
还有小伙伴提到,横版的图片,不适合手机端阅读——“应该多考虑移动互联网时代的需求”。
内容上:
争议11:“我不知道作者想说明什么”——数据细节和解释的缺失
这一争议主要发生在“探索类的可视化”上。这种可视化主要是呈现了一系列数据信息,让读者去自由探索,但没有明确的故事线或者阅读指引。这类可视化“信息很多,可以慢慢看”,但也可能“让我不知道主题是什么,我能学到什么”。
争议12:“为什么让我猜半天?”——标题、结论等主要信息的滞后
在一些作品中,作者可能为了制造悬疑、增加艺术性等意图,将重要信息放在靠后的位置。但是这可能导致读者在一开始处于“一脸懵”的状态,甚至失去阅读兴趣。
争议13:“我觉得作者在误导我”——由于数据选取造成的偏见
最后一个争议点在于数据的选取。被作者挑选出来的数据变量,不一定能反应事情最真实的一面,甚至可能产生“关联性错觉”。比如,在刚在提到的例子中,作者将马克思、恩格斯的来往信件,及他们各自的著作并列放置,但“作者似乎在暗示马克思的著作一定与恩格斯有关”。
再比如,最近被网友疯狂吐槽的一个可视化项目,用航班开放程度、城市封锁程度等来评估各国的“新冠恢复力排名”(covid resilience ranking),结果是美国被排到了第一位。其最被抨击的一个点就在于,抛开疫情的病例数、死亡数去谈“恢复力”,忽略了数据之间的相关性。恢复力高,不等于疫情不严重。恢复力低,也并不等于疫情很严重。如果作者本身就在盲人摸象,又怎么能期待读者买ta的账呢?
但是,吐槽之余,我们也惊喜的发现:到场的可视化爱好者基本对可视化的创新性有着较大的宽容度,比较少会因为一个作品的不完美而否定掉其创新性。
可视化的创新突破,有时难以面面俱到。一个作品,也可能无法做到各方面都完美。
组织这次吐槽大会,课代表是希望可视化这门美妙的艺术,在坚持创新的基础上,仍然能时时回应读者的关切,从而能将创作者的创作激情更彻底的传递到读者心中。
以上就是我们针对“数据可视化吐槽大会”的总结。你最常踩的是哪些坑?还有哪些坑值得补充?欢迎留言告诉我们~
撰稿 蓝星宇
◒◡◒
┊推 - 荐 - 阅 - 读┊