新世野 | 进行可视化之前,你需要考虑这四点
本文作者是Carbon Brief的一名多媒体记者,Carbon Brief是一个专门报道气候变化和能源数据驱动的网站。在这篇文章中,本文作者将讲述她所在团队在制作美国电力资源交互式地图时所作的一些关于数据可视化的决策,这是本文作者迄今为止做过的最庞大的项目之一。
可视化还是不可视化
每当本文作者开始着手一个新的项目的时候,她总是从最明显的问题开始思考:这些数据是否真的需要进行数据可视化?虽然把所有的数据变成花哨的信息图看起来是一件很棒的事情,但并不是所有的数据都可以通过这种方式变得更具有可读性---有时候简单的统计数字或者数据表格,都会使数据的呈现更清晰并且更有说服力。本文作者见过最糟糕的图形来自于那些不需要可视化的数据---用视觉感官上的花里胡哨来弥补数据本身的缺点。(比如,3D饼图就往往出现在这种场合中)
然而,正如数据可视化大师Alberto Cairo所指出的,汇总统计不能告诉你一切。
原文链接如下:https://twitter.com/AlbertoCairo/status/765167969139765250
这个项目灵感来源于本文作者的同事西蒙-埃文斯所整理的电子表格,其中包含近9000个美国电源的详细信息,比如他们所在的位置等信息。
面对如此丰富的数据源,本文作者所在的团队从一开始就很清楚的知道,肯定需要做一些数据可视化的工作,因为首先他们需要弄清楚电子表格中的内容,而数据的可视化也可以帮助他们发现数据源中潜在的错误(比如:数据源中几个发电厂的经纬度被弄混了,导致他们最终显示的位置位于格陵兰岛的上空)
静态图表还是交互式图表
在《纽约时报》前图形编辑格雷戈尔·艾施(Gregor Aisch)『https://vimeo.com/182590214』透露只有10-15%的读者会点进去看电子报纸的互动图形时,数据可视化界就互动图形是否值得付出努力进行了一些争论『https://medium.com/@dominikus/the-end-of-interactive-visualizations-52c585dcafcb』,在考虑实现数据交互(尤其是需要使互动图形在不同设备上兼容)需要做的工作之后,人们认为这是一个相当严峻的问题。在其他的领域,英国《金融时报》的互动编辑马丁·斯塔贝认为『https://www.ft.com/content/c62b21c6-7feb-11e6-8e50-8ec15fb462f4』
“过多的数据交互反而会妨碍读者的理解,因为它将责任从从设计师转移到了读者身上,需要读者自己去理解数据图标中传达的重要的信息。”
但艾施也对人们应该使用数据交互进行了慷慨激昂的辩护:"知道大多数读者不点击按钮并不意味着不应该使用任何按钮;知道很多人都会忽略工具提示,并不意味着不应该使用任何工具提示。它所意味着的是,设计师不应该把重要的内容隐藏在互动后。"『https://www.vis4.net/blog/2017/03/in-defense-of-interactive-graphics/』
我们有很多理由去做交互式图表。对于本文作者来说,当数据源无法用简单的统计数据或者数据表格来表达的时候,她认为最好可以使用交互式图表来进行表达。像本文中所提到的美国电力资源地图这样的大型空间数据源可能包含数百个不同的图表,特别是在地方一级,在所附的文章中读者没有办法进行讨论,此时交互式图表包括使用过滤器和工具提示等功能可以使对相关领域感兴趣的读者了解更多相关资讯,而这种功能有助于让数据更具有特点。例如,当本文作者所在的团队发表关于德国和英国能源的文章时,他们读者中对于能源极客感兴趣的部分群体就可以点击文章中的地图进行深入的了解。
交互式图表也允许读者浏览完整的数据源。这种对数据进行透明化的处理也是对数据分析能力的认证,这也是作者所在的网站Carbon Brief所重视的。
决定,决策
所以,当我们有一个数据源,我们希望把它做成数据可视化中的交互图表,那么我们应该要如何做呢?这完全取决于我们最终想要呈现的数据效果。
当特朗普总统试图推翻奥巴马所推出的气候变化政策和“扭转煤炭战争时”,我们希望这个专题能够向人们展示关于美国电网当前构成的细节。作者所在的团队希望可以展现出美国电力资源系统的多样化,并且可以反映出自然资源的不同可用性,以及各州不同的能源政策。
首先可以建立一个气泡图,其中气泡的大小代表每个发电厂的发电能力,颜色代表电力来源的类型,这似乎是目前描述美国电力系统组成最简单的方法,一目了然。我们选择的视图类型让浏览者在不需要互动的情况下也可以对电网的地理环境有一个直观的了解,但如果读者想了解更多信息,那我们就可以使用工具提示和过滤器等互动元素。
作者所在的团队选择了不把任何叙述强加给读者的数据可视化,因为在接下来的文章中有详细的数据分析,读者可以按照他们选择的顺序自由地探索地图,而不是像滚动器那样,让读者一步步地浏览数据。假设美国电力资源地图是一个有用的资源,读者可以重复进行查看,所以原文作者所在的团队希望尽可能的使整个数据源集中在一起,便于读者进行访问。
对于数据可视化过程中所使用的工具,作者所在的团队曾经使用过Carto(一种现成的地图工具)来创建其他项目的交互式地图,但是在制作美国电力资源交互式地图时,原文作者决定在这张地图上使用Leaflet.js。虽然会增加可视化过程的工作量,但是使用这个JavaScript库有以下几个优点:
加载速度更快,当数据源有近9000行数据时,这是一个相当重要的影响因素 使用纯代码制作的数据可视化更灵活,并且可以拥有属于自己系统的交互式图表 API相对简单 这个库是开源的数据库(也可以使用Mapbox.js)
以这种方式进行数据可视化,有助于突出数据源中令人惊讶的特点,例如太阳能发电在北卡罗来纳州等州高度集中
但使用气泡图会带来一些问题。由于最高和最低容量的发电厂之间的相差很多(从1兆瓦到6459毫瓦),如果我们让气泡的大小与它的容量成正比,那么最小的发电厂的气泡是可以忽略不计的,而最大的气泡则会充满整个地图。
*没有最小尺寸的示例
但是如果我们想要添加一个工具提示,这同样会产生一个问题,因为最小的工厂太小了,而气泡不容易悬停在上面。所以我们需要制定新的规则,创建一个最小的气泡大小,然后将其他的气泡缩小一点,从而保持最小的工厂可见。
但我们还没有走到那一步。虽然做出上述改变可以带给用户更好的体验,但是创建一个最小尺寸并将较小的气泡移到前景上,在某种程度上过度强调了小工厂的重要性。而且,虽然我们已经对美国的工厂的所在位置已经有了一个很好的了解,也对他们的比例有了一个粗略的概念,但是要准确的计算出来还是有点困难。这是因为与其他的图形属性相比(比如位置或者长度)我们的眼睛并不擅长解释被视觉编码为面积的数据。
因此,本文作者决定创建一个面板,用来配合主地图,用D3.js制作条形图。使用额外的条形图与气泡图并行,弥补了气泡地图的不足,由此读者可以更加准确的计算出美国电网的组成。条形图同时充当密钥。
使用D3的优点是你可以在不同的图表之间设置一些好看的过渡,在原文作者设计的这张地图中,条形图会在读者选择不同的美国州时发生变化,除了更加美观之外,这些动画图表还有助于吸引读者的注意力。
关于基址图的内容
为了使地图更加生动,原文作者在几种不同的背景之间添加了切换的选项---制图师称之为“基图”。
原文作者选择了三种不同的地图选项,每一种都有自己的优势。
在最小的灰度地图上,数据最突出 美国宇航局的夜间卫星图像允许读者查看电源的使用位置 白天的卫星图像可以让读者看到地理环境对于核电站分布的影响,例如我们可以从上图中看到水电站(浅蓝色)是如何沿着山谷聚集的
较暗的气泡颜色在较浅的地图上更突出,反之亦然,因此使用几种不同的颜色类型有助于使数据可视化的图像变得更加清晰。
扫描二维码阅读原文
文 | 张静红
编辑 | 张静红
往期推荐
点个在看你最好看