关系网络 | 文献精读:复杂的地理流动可视化
本文将详细探讨一篇2017年发表的论文《Many-to-Many Geographically-Embedded Flow Visualisation: An Evaluation》[1],是关于在许多地理位置之间资源流动的可视化,论文作者是Yalon Yang等人。
此论文提出了一个新的可视化样式——MapTrix,混合了不同类型的可视化(地图、关系网络、矩阵)。
MapTrix:呈现地理位置之间资源的流入与流出
根据国家的复杂程度,MapTrix可以分成上图左右两种样式:澳大利亚的州的数量较少,在呈现州跟州之间资源流动时,比较简单,中间的长条图用来表示资源的流入与流出;美国的州数量较多,流动可视化变得复杂许多,因此简化了可视化的设计,删除了中间的长条图。
此论文的二个主要贡献
1、提出一个新的、混合了不同类型可视化的样式——MapTrix。结合了流动与OD矩阵,此可视化保存了这二种可视化类型的优点(保有地理信息、避免视觉杂乱);
2、第一个使用定量研究方法来比较静态流动可视化的论文(静态是指无法交互),大致上是给受测试者指定一些任务,需要理解可视化才能正确回答,回答的正确率与回答时间都会被记录下来。
如同其他类型的关系网络可视化一样,流动可视化的易读性一直是一个问题。如何清楚展现许多地理位置之间的资源流动状态,是很有挑战性的难点。
MapTrix用来展现许多地点之间资源的流动状态。在论文中,MapTrix的设计并不是用来自嗨,而是有明确的目的(在地图上清楚展现复杂的资源流动)并用实验来评估MapTrix的易读性、可理解性等。
这篇论文一样隶属于关系网络可视化的范畴,在视觉上用点线/矩阵表达不同地点之间资源的流动是关系网络可视化的一种。在地图上,地理位置可以视为关系节点(nodes),资源的流动可以用关系线(edges)表达。更多关于节点与线组成的关系网络可视化,在关系网络 | 文献泛读之1:node-link与matrix已经大致梳理,本文着重在跟地理信息结合的关系网络可视化。
对我的启发
这篇论文是我在许多可视化论文中最喜欢的其中一篇,它对我的启发:
1、设计可视化从来不是拍脑袋随意决定的,每一步设计过程,需要有具体的目标支持;
2、体现可视化的“千面”特性,不同类型的可视化可以根据分析任务的不同来进行组合;
3、论文结构清楚,具有良好、易懂的写作逻辑;在写关系网络 | 实操案例分享论文时,学习了这篇论文的写作架构与思路。
流动数据可视化相关文献
根据作者在论文中的阐述,不同地点之间资源、人的移动,称为流动(flow)。关于流动的论文,论文作者将这部分分成以下三类:
要可视化资源流动,不一定需要使用关系网络;用不同地图表明不同时期的数据状态,如上图1、2,一样是展现数据的流动变化。
此论文探讨的主题是流动地图与OD地图,论文作者将在视觉上呈现流动的方法,分成三类:1、流动地图;2、OD矩阵;3、其他方法。
1、流动地图:
在地图上用箭头/线呈现OD(起始&结束),一个经典的例子:
Minard画的这张图,展示1858年人口的流动,线条的粗细代表人口流动的多寡,颜色代表人口的来源国家/地区,例如:黄色是中国,些许人口流入古巴、澳大利亚、加利福尼亚州。(查看高清地图:https://cartographia.files.wordpress.com/2008/05/minard-full.jpg)
但这种方式在数据量变大时,容易导致杂乱并难以阅读,论文作者综述了三种方法来解决此类问题:
2、OD矩阵:
用矩阵的行&列去表示OD,但此类可视化造成的最主要问题是,遗失了地理信息。论文作者归纳了二种解决方法:
3、其他方法:
将地图结合其他可视化来呈现流动数据:
但以上这些方法都分别存在一些不足之处,例如,流动地图的方式还是容易造成视觉杂乱,OD地图则是还没有定量的研究方法来跟其他类型的可视化做评估比较。
MapTrix的设计思路
1、整体视觉层面的设计
论文中详细阐述了设计迭代的三个过程:
2、Leader line放置的算法
为了清楚呈现流动线,论文提出了几个算法来限制流动线的绘制,如:不能有交叉,相邻的线要清楚分开等,详细的算法见论文。
定量研究&研究后的重新设计
将MapTrix与flow map跟OD地图定量比较。为了与MapTrix具有可比较的基础,论文作者设计了定制的flow map、OD map。例如,Flow map的设计,基本上是将flow线捆绑并使用渐层颜色来表示flow的方向。
评估MapTrix易读性的实验,具体而言是跟同样表示资源流动的可视化做比较:
以澳大利亚为例:
(a)Bundled Flow Map,在澳大利亚地图上,把各个州之间的关系线聚集起来,用来表示州跟州的资源流动(flow);
(b)OD Map,将地图简化成数个大方格(代表澳大利亚的每一个州),这些大方格尽量排列成澳大利亚的形状,并在每个大方格内嵌入数个小方格。这种方式取代了关系线的使用,可以展示不同州之间的资源流动,小方格的颜色代表流入这些州的资源数量;
(c)MapTrix,同时使用地图与矩阵,用地图展示位置的地理信息,用矩阵展示每个位置之间的资源流动状态,每个矩阵的小方格的颜色代表州跟州的资源流动数量。
通过许多测验后(详见论文),结果显示,OD地图与MapTrix有相似结果,但flow地图表现不佳(did not scale at all well);实验参与者偏好MapTrix。
在第二次实验时,使用了比较复杂地图,来考验MapTrix的延展性。第一次实验用的是澳大利亚的地图,澳大利亚的地理位置点比较少,在第二次实验时,选了具有较多地理位置点的美国。
第一次研究flow map的表现明显比MapTrix、OD地图差,所以第二次研究时只比较MapTrix、OD地图。
因为选用了比较复杂的地图,所以可视化的设计上有所调整:因连接线过多,移除了地图与矩阵中间的长条图:
结果显示,MapTrix、OD地图仍具有相似的表现,而且两种方法可以适用51x51的流动线。研究也显示,受测试者花了更多的时间来回答题目。
复杂Maptrix的交互版本
因为地图变复杂后,静态的可视化样式已经无法清楚呈现,所以论文作者研发了可交互的MapTrix。
交互版的MapTrix可以针对特定的地理位置进行展示,选定部分的地理位置后,右边的矩阵也相应简化,只显示这些位置的对应关系。
交互版的MapTrix在设计上跟静态的版本有些不同,不只是交互上的区别,还有视觉呈现上的不同,这个交互版本并没有通过定量研究来评估易读性。
(交互版本的demo链接 https://vis.yalongyang.com/maptrix/index.html)
结语
在2017年秋季上关系网络这门课时,我们阅读了许多相关的论文,并需要在课堂上、网上讨论心得,老师要求我们除了总结论文的贡献之处,还需要以自己的观点提出论文的不足之处。我个人认为这是是个很好的思辨训练。永远要对现有的可视化提出不足之处,并提出改进的方式,这样可视化的创新与进步才能不断的持续下去。
我当时提了两点可以改进的地方,简要陈述如下:
1、对于目标用户没有详细的说明
2、可视化的交互不是很直观
阅读这篇文章的读者们也可以留言讨论,你认为MapTrix的三种设计样式在哪些部分有所不同,以及你认为这样设计好或不好,还有可能可以的改进方式有哪些
Reference
1.Y. Yang, T. Dwyer, S. Goodwin and K. Marriott, "Many-to-Many Geographically-Embedded Flow Visualisation: An Evaluation," in IEEE Transactions on Visualization and Computer Graphics, vol. 23, no. 1, pp. 411-420, Jan. 2017.
doi: 10.1109/TVCG.2016.2598885
URL: http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=7539669&isnumber=7747554