查看原文
其他

数据可视化的基本规范,15张图打包一次讲清楚

小熊妹 码工小熊 2021-09-26

前天,小熊妹的同事发过来一张图,问:“小熊小熊,你能从这个图里看出啥问题吗?”(如下图)


                           

小熊妹当时就震惊了!从这张图,我们可以直观、清晰、明确的看出:“这位同学,你不会做数据图呀!”两个人比身高,不应该背靠背吗,为啥要叠罗汉呢……


 

那正确的图该咋画呢?今天小熊妹认真科普一下哦。做数据图只是个通俗说法,行业习惯叫:数据可视化。数据可视化,可以做出很多炫酷的图表,但也不是乱做的,需要遵循一些基本规范。



什么时候该做可视化


当数据描述很简单的时候,是不需要做可视化的。比如:小熊妹12月份全月个人消费了10000元。这时候只有1个对象,1个指标,1个时间,也没有细分这10000元到底都花到哪里去了,这就属于典型的简单数据,这时候不用做可视化,直接展示出来就好了,多清晰(如下图)


 

如果需要描述的数据变得复杂,就可以用图表的形式,让数据变得更容易看,更容易理解。评价数据是否复杂的,是对象,指标,时间,细分四个方面。下边来一个个看看吧~


简单的数据可视化


其他条件不变,当对象从1个变成N个,这时候可以用条形图来展示。比如大家看到小熊妹一个月花了10000大洋!就会想:“哇塞,小熊妹是不是个败家娘妹呢?”这个只有1个人肯定看不出高低,是勤俭持家还是败家,得和其他妹纸比一比(如下图)。


 

条形图很适合做多个对象之间的比较。因为这种从上到下的陈列方式,很符合人们心中“皇榜”“赛马图”的格局,因此一看过去便知道高低,比直接陈列数字看的清楚。这就是数据可视化的第一个优势:清晰

 

只是,只是这么一对比,就显得小熊妹真的很败家了!才不是呢,哼!


 

其他条件不变,要考虑一个指标的内部结构,这时候可以用饼图。比如光看小熊妹月消费1万,看起来很败家,可到底花到哪里了呢?如果在北上深这种高消费城市,日常生活都不止1万吧。所以得看看这一万块的构成,这就是内部结构了(如下图)


 

饼图很适合看内部结构组成。因为切大饼的方法,很直观,能一眼看到占大头的是哪里。这就是数据可视化的第二个优势:直观

 

只是,只是这么一对比,小熊妹的败家似乎更加实锤了!居然有那么大比例网购!肯定在12月剁手剁了不少,熊爪子估计都剁没了!


 

其他条件不变,要考虑一个指标的时间变化,这时候可以用条形图。比如想知道小熊妹是一直这么败家,还是偶尔剁剁手,光看一个月数据不行,还得多几个月,这时候可以如下图:


 

诶?这么一看,似乎为小熊妹洗白了一点:人家只是双十一,双十二的时候才败家吗,平时吃土吃的可积极了!这就是数据可视化的第三个优势:发现规律。数据走势本身,能反应很多问题。

 

如果把时间再放长一点,条条数量更多,可能看不清楚,这时候可以用折线图,比如看小熊妹过往2年的数据,这样至少有24个数,用折线图看的更清楚(如下图)


 

时间拉长,看趋势会更清楚。这么看的话,小熊妹就被洗的更白了:人家只是618,双十一,双十二,过年的时候花的多吗!平时是个积极的吃土小能手。


 

其他条件不变,要考虑多个指标的内部结构,这时候可以用雷达图。

 

 

但要注意,如果不同指标单位不一样,直接做雷达图会显得很奇怪,比如收入的单位是元,身高单位是厘米,颜值只能内心打分。这时候可以对每个指标,单独做评分或者做标准化处理,处理成统一的评分或者指数,再做雷达图。

 

复杂的数据可视化


如果用数据描述复杂的问题,对象,指标,时间,细分四个方面,就有两个方面及以上发生变化,做图就会复杂。

 

比如,我们不单单想知道小熊妹过去1年内每个月的消费,每个月的逛街次数,这两个孤立的数据。我们还想知道:是不是逛街越多,花钱就越多。这时候我们想发现的,是数据之间的相关关系,就可以做散点图(如下图所示)


 

散点图虽然不能严格论证相关关系,但是可以很直接的反应出来,如果散点图真的分布很散,就说明两个指标之间没啥关系,如果散点图出现一定的规律性,则表明有深入分析的机会点。这是数据可视化的第四个好处:方便。做个图可比做各种模型,算各种检验值方便多了。 

 

如果想观察一个指标在不同时间的结构变化,可以用堆积图(如下图)


 

堆积图在分析问题的时候,非常有用!比如从上图,能直接看出来,小熊妹消费额变化,主要是网购份额变化导致的,真是网购小能手! 

 

同样的,如果想对比两个对象的结构变化,也用堆积图比较合适。相比饼图,堆积图在反应不同个体的差异的时候,看的更清楚。比如下图,是不是一眼能看出来,萱萱是个吃货呢。



如果想对比N个对象在不同时间的指标变化,可以用折线图。这种对比会衍生出一种方法:趋势分析法,后续有机会再分享哦。如下图所示:


  

如果想对比N个对象在N个指标的差异,可以用雷达图。如下图所示:


 

小结来了


反映内部结构:饼图、堆积图

反映时间变化的:柱状图、折线图

反映排名顺序的:条形图

反映相关关系的:散点图

反映多个指标的:雷达图


记住了没?所以开头的图应该咋画?可以这样画,看的更清楚(如下图)

 

 


更复杂的数据可视化


可能大家看完,会问,如果是:N个对象、N个指标、N个时间、还带细分的,该怎么做可视化。这个也难不倒小熊妹,因为真遇到这个情况,就不是一张图表能说清楚的了大家感受下,这种N连击问题,在实际中是啥效果

 

 

这时候一定得先把问题整理成清晰的,一个一个独立的,相对简单的小问题,再一个个讲哦


 

至于咋整理,这是另一回事了。有机会小熊妹再分享。不说了我要跑数去了,点个在看支持下哦。

往期精彩回顾

数据分析的求职前景,你关心的问题都在这!
听说2021年,这个职业就要被取代了!
小熊妹:自然增长率,到底怎么算才合理!

扫码关注码工小熊

和码工码农们一起搞事情!



因为你的分享、点赞、在看我精气神儿十足!
: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存