查看原文
其他

人人都会用到的数据可视化之常用图表类型

2016-05-15 在学古筝的程序员 天善智能

文章来自天善智能 www.hellobi.com 博客专栏,作者:在学古筝的程序员

文章介绍

数据可视化”可以帮助用户理解数据,一直是热门方向。


图表是”数据可视化”的常用手段,其中又以基本图表—-柱状图、折线图、饼图等等—-最为常用。

用户非常熟悉这些图表,但如果被问道,它们的特点是什么,最适用怎样的场合(数据集)?恐怕答得上来的人就不多了。


本文是电子书《》第一章的笔记,总结了六种基本图表的特点和适用场合,非常好地回答了上面的问题。


序言

进入正题之前,先纠正一种误解。


有人觉得,基本图表太简单、太原始,不高端,不大气,因此追求更复杂的图表。但是,越简单的图表,越容易理解,而快速易懂地理解数据,不正是”数据可视化”的最重要目的和最高追求吗?


所以,请不要小看这些基本图表。因为用户最熟悉它们,所以只要是适用的场合,就应该考虑优先使用。


一、柱状图(Bar Chart)

柱状图是最常见的图表,也最容易解读。

它的适用场合是二维数据集(每个数据点包括两个值x和y),但只有一个维度需要比较。年销售额就是二维数据,”年份”和”销售额”就是它的两个维度,但只需要比较”销售额”这一个维度。


柱状图利用柱子的高度,反映数据的差异。肉眼对高度差异很敏感,辨识效果非常好。柱状图的局限在于只适用中小规模的数据集。


通常来说,柱状图的X轴是时间维,用户习惯性认为存在时间趋势。如果遇到X轴不是时间维的情况,建议用颜色区分每根柱子,改变用户对时间趋势的关注。

上图是英国足球联赛某个年度各队的赢球场数,X轴代表不同球队,Y轴代表赢球数。


二、折线图(Line Chart)数据

折线图适合二维的大数据集,尤其是那些趋势比单个数据点更重要的场合。

它还适合多个二维数据集的比较。

上图是两个二维数据集(大气中二氧化碳浓度,地表平均气温)的折线图。


三、饼图(Pie Chart)

饼图是一种应该避免使用的图表,因为肉眼对面积大小不敏感。

 

上图中,左侧饼图的五个色块的面积排序,不容易看出来。换成柱状图,就容易多了。


一般情况下,总是应该用柱状图替代饼图。但是有一个例外,就是反映某个部分占整体的比重,比如贫穷人口占总人口的百分比。

四、散点图(Scatter Chart)

散点图适用于三维数据集,但其中只有两维需要比较。

上图是各国的医疗支出与预期寿命,三个维度分别为国家、医疗支出、预期寿命,只有后两个维度需要比较。


为了识别第三维,可以为每个点加上文字标示,或者不同颜色。

五、气泡图(Bubble Chart)

气泡图是散点图的一种变体,通过每个点的面积大小,反映第三维。

上图是卡特里娜飓风的路径,三个维度分别为经度、纬度、强度。点的面积越大,就代表强度越大。因为用户不善于判断面积大小,所以气泡图只适用不要求精确辨识第三维的场合。


如果为气泡加上不同颜色(或文字标签),气泡图就可用来表达四维数据。比如下图就是通过颜色,表示每个点的风力等级。

六、雷达图(Radar Chart)

雷达图适用于多维数据(四维以上),且每个维度必须可以排序(国籍就不可以排序)。但是,它有一个局限,就是数据点最多6个,否则无法辨别,因此适用场合有限。


下面是迈阿密热火队首发的五名篮球选手的数据。除了姓名,每个数据点有五个维度,分别是得分、篮板、助攻、抢断、封盖。

画成雷达图,就是下面这样。

面积越大的数据点,就表示越重要。很显然,勒布朗·詹姆斯(红色区域)是热火队最重要的选手。


需要注意的时候,用户不熟悉雷达图,解读有困难。使用时尽量加上说明,减轻解读负担。



相关大数据、数据挖掘与分析文章

初学者面试数据分析岗必要准备

数据挖掘问答精选收藏

与Greenplum结伴而行

你的客户你分析了吗,如何做到资源利用最大化

我只能帮到这儿了-爬虫世纪佳缘篇

数据挖掘推荐系统综述以及美团推荐系统介绍

从设计到数据-写给非数据人的数据入门

2015年社区博文与 Friday BI Fly 文字版活动记录精选


Friday BI Fly 微信直播内容整理

Python零基础入门实战

金融行业如何构建新一代大数据中心

银行报表的那些事儿

零基础入门数据分析、数据分析师的成长路径微信直播记录

数据挖掘、用户画像微信直播图文全记录

数据治理实战应用、企业级模型规划和管理 


Saturday BI Fly 线下沙龙活动

上海外滩SOHO站活动集锦

北京站大数据、数据挖掘与机器语言学习活动集锦

Smartbi 大数据私有云平台解决方案 


其它视角

IT 外包中的甲方乙方,德国人,美国人,日本人和印度人

数据可视化在中国的发展


天善智能 www.hellobi.com 是一个专注于商业智能BI、数据分析、数据挖掘和大数据技术的垂直社区平台。


问答社区和在线学院是国内最大的商业智能BI 和大数据领域的技术社区和在线学习平台,技术版块与在线课程已经覆盖 商业智能、数据分析、数据挖掘、大数据、数据仓库、Microsoft BI、Oracle BIEE、IBM Cognos、SAP BO、Kettle、Informatica、DataStage、Halo BI、QlikView、Tableau、Hadoop 等国外主流产品和技术。


线上活动:Friday BI Fly 每周五晚 20:30,技术和行业交流,20余个微信直播群互动交流。

线下活动:Saturday BI Fly 在全国各大城市巡回举办200人-500人规模的大数据沙龙交流活动,每月1-2次。


天善智能积极地推动国产商业智能 BI 和大数据产品与技术在国内的普及与发展





您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存