查看原文
其他

Tableau学习——维度和度量、离散和连续(一)

gogodiy 人工智能爱好者社区 2019-04-22

很多Tableau的初学者,经常容易混淆维度和度量、离散和连续各自的定义和关系。下面谈一些个人的理解,希望能起到抛砖引玉的作用。

首先要明确一点,维度和度量、离散和连续,是Tableau对数据源字段分类的两种方式,也就是说,可以按维度和度量对字段进行分类,也可以按离散和连续对字段进行分类。

那么什么时候做这个分类呢?当我们添加数据源后,Tableau读取具体的数据,就会根据数据的特征进行分类:


按照官方的说法:如果字段包含分类数据(比如产品名称、地区、订单日期),就划分为维度;如果字段包含定量数据(比如销售额、利润),就划分为度量。

很绕口,所以我个人理解是这样,分类数据通常是指文字、日期和无意义的数字,定量数据通常是指有意义的数字。

为什么这么说,具体看截图,维度字段,数据类型基本都是字符型和日期型,但是有个另类字段“行ID”,前面的#表示该字段类型为“数字(整数)”:


但是Tableau认为,该数字仅用于标识每一行,没有实际意义,因此会将其划分为维度。

度量字段,数据类型都是,不论整数还是十进制的小数,并且每个值都是有实际意义,比如销售额是3.80元,数量是5个,利润是-0.25元,等等。



接下来,当我们选中一个维度字段并拖动到行或列功能区的时候,你会发现维度字段呈蓝色,表示离散:


而当我们选择一个度量字段并拖动到行或列功能区的时候,你会发现度量字段呈绿色,表示连续:


这时候的颜色,是另一种分类方式:离散和连续,在起作用。

那么离散和连续又是如何区分的呢?

首先,离散和连续来源于数学术语,官方的解释是:离散是指字段值各自分离且不同;连续是指字段值构成了一个不间断的整体。

有没有一种说了也白说,照样看不懂的赶脚?所以我的理解是,离散是指字段值之间没有什么直接关系,也无所谓先后顺序。比如地区,是先东北,再西北,还是先西北,再东北,无所谓,只要各不相同就行。而连续,是指字段值在一个区间之间是有连贯性的,先后顺序是有意义的,比如销售额,区间肯定是从0到一个最大值,要么按从小到大,要么按从大到小的顺序去观察数据。

有人一定会问,“行ID”呢?它也可以从小到大排列顺序呀!我是这么看的,从关系数据库角度出发,数据记录在数据表里的顺序,如果没有聚集索引,本质上是无序的,“行ID”仅仅起到唯一标识的作用,究竟从1开始,还是从10开始,还是从1000开始,都无所谓,只要在查询的时候确定有意义的排序就可以了。


更多干货

course


Tableau数据分析可视化高手进阶


课程介绍

从理论到实践,从入门到熟练,从基础到提高,通过这个课程,让你不再受困于底层数据的处理,而是可以将自己的智慧充分发挥在数据的展示和解说上。

点击阅读原文立即学习

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存