查看原文
其他

17种经典图表总结,轻松玩转数据可视化!

安琪Angela Python数据科学 2019-07-11

点击上方“Python数据科学”,选择“星标”公众号

重磅干货,第一时间送达

作者:安琪Angela   来源:简书


导读:随着时代的发展,越来越多的数据量堆积,然而这些密密麻麻的数据的可读性较差并且毫无重点,而数据可视化更加直观有意义,更能帮助数据更易被人们理解和接受。


因此运用恰当的图表实现数据可视化非常重要,本文归结图表的特点,汇总出一张思维导图,帮助大家更快地选择展现数据特点的图表类型。


▲图表类型-思维指南(点击可放大)


接下来我将依次介绍常用图表类型,分析其适用场景和局限,从而帮助大家通过图表更加直观的传递所表达的信息。


01 柱状图



展示多个分类的数据变化和同类别各变量之间的比较情况。


  • 适用:对比分类数据。

  • 局限:分类过多则无法展示数据特点。


相似图表:

1. 堆积柱状图。比较同类别各变量和不同类别变量总和差异。

2. 百分比堆积柱状图。适合展示同类别的每个变量的比例。


02 条形图



类似柱状图,只不过两根轴对调了一下。


  • 适用:类别名称过长,将有大量空白位置标示每个类别的名称。

  • 局限:分类过多则无法展示数据特点 。


相似图表:

1. 堆积条形图。比较同类别各变量和不同类别变量总和差异。

2. 百分比堆积条形图。适合展示同类别的每个变量的比例。

3. 双向柱状图。比较同类别的正反向数值差异。


03 折线图



展示数据随时间或有序类别的波动情况的趋势变化。


  • 适用:有序的类别,比如时间。

  • 局限:无序的类别无法展示数据特点。


相似图表:

1. 面积图。用面积展示数值大小。展示数量随时间变化的趋势。

2. 堆积面积图。同类别各变量和不同类别变量总和差异。

3. 百分比堆积面积图。比较同类别的各个变量的比例差异。


04 柱线图



结合柱状图和折线图在同一个图表展现数据。


  • 适用:要同时展现两个项目数据的特点。

  • 局限:有柱状图和折线图两者的缺陷。



05 散点图



用于发现各变量之间的关系。


  • 适用:存在大量数据点,结果更精准,比如回归分析。

  • 局限:数据量小的时候会比较混乱。


相似图表:

  • 气泡图。用气泡代替散点图的数值点,面积大小代表数值大小。


06 饼图



用来展示各类别占比,比如男女比例。


  • 适用:了解数据的分布情况。

  • 缺陷:分类过多,则扇形越小,无法展现图表。

相似图表:

1. 环形图。挖空的饼图,中间区域可以展现数据或者文本信息。

2. 玫瑰饼图。对比不同类别的数值大小。

3. 旭日图。展示父子层级的不同类别数据的占比。


07 地图



用颜色的深浅来展示区域范围的数值大小。


  • 适合:展现呈面状但属分散分布的数据,比如人口密度等。

  • 局限:数据分布和地理区域大小的不对称。通常大量数据会集中在地理区域范围小的人口密集区,容易造成用户对数据的误解。


相似图表:

1. 气泡地图:用气泡大小展现数据量大小。

2. 点状地图:用描点展现数据在区域的分布情况。

3. 轨迹地图:展现运动轨迹。


08 热力图



以特殊高亮的形式显示访客热衷的页面区域和访客所在的地理区域的图示。


  • 适合:可以直观清楚地看到页面上每一个区域的访客兴趣焦点。

  • 局限:不适用于数值字段是汇总值,需要连续数值数据分布。

09 矩形树图



展现同一层级的不同分类的占比情况,还可以同一个分类下子级的占比情况,比如商品品类等。


  • 适用:展示父子层级占比的树形数据。

  • 缺陷:不适合展现不同层级的数据,比如组织架构图,每个分类不适合放在一起看占比情况。


10 指标卡



突出显示一两个关键的数据结果,比如同比环比。


  • 适合:展示最终结果和关键数据。

  • 缺陷:没有分类对比,只展示单一数据。


11 词云



展现文本信息,对出现频率较高的“关键词”予以视觉上的突出,比如用户画像的标签。


  • 适合:在大量文本中提取关键词。

  • 局限:不适用于数据太少或数据区分度不大的文本。

12 仪表盘



展现某个指标的完成情况。


  • 适合:展示项目进度。

  • 局限:只适合展现数据的累计情况,不适用于数据的分布特征等。

13 雷达图



将多个分类的数据量映射到坐标轴上,对比某项目不同属性的特点。


  • 适用:了解同类别的不同属性的综合情况,以及比较不同类别的相同属性差异。

  • 局限:分类过多或变量过多,会比较混乱。


14 漏斗图



用梯形面积表示某个环节业务量与上一个环节之间的差异。


  • 适用:有固定流程并且环节较多的分析,可以直观地显示转化率和流失率。

  • 局限:无序的类别或者没有流程关系的变量。


15 瀑布图



采用绝对值与相对值结合的方式,展示各成分分布构成情况,比如各项生活开支的占比情况。


  • 适合:展示数据的累计变化过程。

  • 局限:各类别数据差别太大则难以比较。

16 桑葚图



一种特定类型的流程图,图中延伸的分支的宽度对应数据流量的大小,起始流量总和始终与结束流量总和保持平衡。比如能量流动等。


  • 适合:用来表示数据的流向。

  • 局限:不适用于边的起始流量和结束流量不同的场景。比如使用手机的品牌变化。

相似图表:

  • 和弦图。展现矩阵中数据间相互关系和流量变化。数据节点如果过多则不适用。


17 箱线图



是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法。


  • 适用:用来展示一组数据分散情况,特别用于对几个样本的比较。

  • 局限:对于大数据量,反应的形状信息更加模糊。


专注于数据科学领域的知识分享

欢迎在文章下方留言与交流


推荐阅读 

Python并不完美,Swift正在成长为深度学习语言

效率提高N倍的19条MySQL优化秘籍

抖音上好看的小姐姐,Python给你都下载了

python爬虫 | 一文搞懂分布式进程爬虫

越来越像 Linux 了!Windows 系统 5 月更新让 Python 开箱即用

李宏毅:1 天搞懂深度学习,我总结了 300 页 PPT(附思维导图)


觉得不错,不妨点个好看❤️

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存