查看原文
其他

就是这些表,总是搞关系!

想喝咖啡的课代表 澎湃美数课 2021-07-30


最近,课代表看到很多不是可视化圈的人都被《自然》论文网络的可视化惊艳到。

这个视频分析了 100 多年的 8.8 万多篇《自然》论文,视频中的一个点代表一篇论文,颜色代表学科。如果有其他的科研论文(被Web of Science收录的)同时引用了这篇论文,那么它们之间就会有连线,而点的大小则代表被引用的次数。

科学+艺术的结合着实令人着迷,论文之间主题和引用次数形成一张庞大的关系网。

今天课代表就给大家理理可视化中的“关系户”的历史与发展 课代表已划好重点👇)

  • 层级关系树状图

  • 流动关系桑基图

  • 复杂关系网络图


✧✧

层层传递的树状图大家族


树状图,一种在中世纪就出现的古老图表。顾名思义,就是以树的结构一样,从根部到树干再分叉到树枝,是一目了然的结构关系。

在中世纪鼎盛时期,谱系树是最早出现的树状图原型之一,主要用于皇室和贵族家庭的家谱和宗教关系梳理。

⌂ 卡洛·马吉家谱图(1568年-1573年) 

下面这张插图来自《民法大全》(又名《查士丁尼法典》)的一部分,以树状图形式展示了某一专著的相关免责条款。

⌂ 1551年,免责条款之树,作者波尔塔的阿普德·于戈内姆

最初,树状图的应用还只局限在皇室贵族宗教神学,后来便越来越务实。下方这张树状图被经济学家认为是人类绘制的第一张组织管理图。

⌂ 1855年,纽约和伊利铁路管理规划图,作者丹尼尔·克雷格·麦卡勒姆 

这张图展示了纽约和伊利铁路公司行政职责和各阶层人员的分布情况,图中展示了共4715位公司员工在5个主要部门(业务部分)和其他分部门(客货运送部门)的分布情况。最下方的圆圈代表的是公司总裁和董事会。

树状图自然逼真的树木形态必然会被风格化的抽象模型所取代,这是由树状图的自然发展历程所决定的。很多新模式融合了多种定量数据属性,例如大小、长度、价格、时间等,此外还有效地借助色彩表明类型、等级、性别等。

下图展示了美国西弗吉尼亚一个庞大家族五代人的家谱,不具备枝干树叶的图案,也不再是从下而上的展开模式,采用圆形模式,从中心扩展,每一圈代表一代人。
⌂ 1938年 马尔勒·沃尔特的“短足趾的五代人”。

这张图在图表的信息量上相比以往的层级关系也更加丰富。除了树状结构的变化,该图表借助几何形状代表性别,男性,女性,如果有短足趾症状的,则图形会填色■●

这种具有放射状树状结构的层次结构数据,其中根节点位于中心,层次结构向外移动,节点的面积和颜色可根据其他定量维度编码。我们称之为径向树状图

课代表之前做的《诺贝尔奖去哪里?》就是通过这个类型,把奖项分布根据不同奖项的颜色,以及标注每项类别的得奖比例较多的国家,展示诺贝尔奖花落国家,这种圆形布局方式不仅一览全局,而且非常节省空间

旭日柱状图和径向树状图类似,从中心的圆圈表示根节点并向外扩散,由内向外依次递减。旭日树状图除了有层级关系,还涉及了每个部分的数量关系

下面这张旭日柱状图于1921年首次发表在《机械工程杂志》上,描述的是从1910年到1919年期间美国联邦政府的平均年度净支出情况。从中可以看出第一大类和其子类别的支出情况。

⌂ 1921年 《机械工程杂志》

关于用面积大小表示各部分的比例关系图表,还有矩形树状图

它们将层次结构(树状结构)数据显示为一组嵌套矩形。树的每个分支都有一个矩/圆形,然后用代表子分支的较小矩形进行平铺,每个矩形的面积以某个定量维度编码。

⌂ 1874年 美国各州人口情况分布图

随着时间的发展,计算机、互联网和算法生成的模型也催生了一系列新方法和新设计。

比如20世纪初,有了一种新型树状图模型——沃罗诺伊图(泰森多边形树状图),它的理论基础是由笛卡尔提出的欧几里得空间数学分割原理。乌克兰数学家格奥尔吉·沃罗诺伊(Georgy Voronoy)对这种灵活的格子结构进行了研究和界定。

虽然这个递归组合方式和矩形树状图相似,但是由于沃罗诺伊图通过灵活布局和设计个体细胞,避免了使用相同的几何形状和高宽比,所以细分区域的布局更加清晰合理。

沃罗诺伊图遵从灵活的组织原则,其布局有序,形态丰富,有时候整体看起来仿佛是一篇彩色玻璃或是迷人的自然形态。

可视化设计 Alberto Lucas López 就以多边形树状图为基本模型,制作了世界语言的可视化。

⌂ 作者 Alberto Lucas López

于沃罗诺伊图的制作方法,课代表在美数课堂第一课就教大家这个图表啦,复习请戳👉沃罗诺伊图制作方法

✧✦

流动关系桑基图


桑基图其实是一种表现流程的示意图,用于描述一组值到另一组值的流向,但从中我们也可以看到一个流动以及包含的关系,高度表示其值,其宽度与值成比例。

关注我们美数课的同学们想必对下面这张图感到特别熟悉吧~

这是查尔斯·约瑟夫·米纳德 (Charles Joseph Minard)绘制的《1812年拿破仑东征地图》,该图描绘了拿破仑的军队自离开波兰-俄罗斯边界后军力损失的状况,黄色代表军队往俄国行进,黑色则代表自俄国撤退。粗细为军队人数,除此之外,图表还包含了行军距离、当时温度、经纬度、移动方向的信息。 

当然,地理信息并不是必要元素。我们日常做的桑基图,只要保证始末两端的流量大小一致,一般情况下,桑基图的结构一般情况是左右结构或者上下结构。


关于桑基图的做法,课代表也在之前的课上讲过啦~复习请戳👉 美数课堂 |制作桑基图


✧✧

复杂的网络关系网

如今面对海量的数据,网络可视化可以用来解决可视化大量数据之间的复杂关系。

可视化设计师和作家曼努埃尔·利马(Manuel Lima)在他编写的《视觉复杂性:信息的映射模式》中列举了他认为的网络主义的形式 。

⌂ 《视觉复杂性:信息的映射模式》网络主义的形式

其中像网络图这种可视化阐明了实体之间的关系,实体显示为圆形节点,线条显示它们之间的关系

比如小说中的人物关系就很适合用这种网络图呈现。

有人就给《罗密欧与朱丽叶》里面的人物之间的对话量做了这样一个心形网络关系网,线段粗细代表两个人之间的对话词汇量,颜色代表不同的家族(此图红色线条应该是House Capulet,图上标注有误),有意思的一点是罗密欧和朱丽叶的对话词汇量才排到第5名。

https://www.reddit.com/r/dataisbeautiful/comments/8ivizh/visualisation_of_words_spoken_between_romeo_and/

数据科学家和数据艺术家 Kirell benzi 专注于网络科学与数据可视化,他基于数据创作了一系列关于网络关系的艺术可视化,以节点和边为特征,这些节点和边被聚集成具有大自然属性的艺术效果。

⌂ https://www.kirellbenzi.com/art/secret-knowledge

比如上图像花朵一样的可视化,是 Kirell 制作的维基百科词条的关系图,每个节点代表一组页面,在与世界新闻或事件有关的特定主题上,许多人访问了这些页面。如果节点都引用过一个或多个共同页面,则它们将连接在一起。花瓣是通过将给定主题中的所有节点组合在一起并堆叠在一起而形成的。以圆环的形式显示,不同的主题之间有着很好的联系。

当然这么多线交织的可视化,阅读门槛也比较高,所以有些网络可视化也会做开篇讲到的《自然》论文网络的可视化视频或者是交互,帮助读者去逐步理清可视化中的故事。

麻省理工学院可视化团队制作做了 Twitter 上提及新冠病毒可视化的项目。不同的颜色代表不同类型的政党、媒体或组织,连线表示他们的发言与其他人员有互动。随着鼠标的滚动,逐步解释每个类型里面的特征,让读者可以层层消化信息。

好啦,大家对于这些“关系户”图表还有什么想说的,欢迎留言告诉我们~




◒◡◒

┊推 - 荐 - 阅 - 读┊





    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存