查看原文
其他

掌握这几条小贴士,快速提升数据可视化能力!

吕薇 腾讯大讲堂 2020-02-18

作者 | 吕薇,腾讯员工

来源 | 互娱增值服务部

原文标题 | 浅析数据可视化与应用思路


好的数据可视化图表可以救命

约翰·斯诺(John Snow)在1854年制作了伦敦霍乱地图,通过标记死亡地图,清晰的了解到霍乱的源头,总而挽救了无数的生命。

(图片来源百度)


南丁格尔玫瑰图通过简单数据对比,更明晰表达军队医院季节性死亡率,打动了军方高层,军事改良提案得到了支持,方案实施后,伤员的死亡率很快从42%降低到了2%

(图片来源百度)

说回到我们现实的生活,当前和平年代,可视化也是在不断帮助我们:比如每天我们要看的路况图,天气走势图等等,都能一目了然的把信息传递给我们,让我们能够更方便的做出决策。

(图片来源百度)

可视化分析的步骤

举一个例子简要说明一下:

(1)当前问题:

我发现付费数据下降了,这时候我要用RCA分析法,一步步找出问题,思考分析数据需要什么数据(活跃ARPU下降,付费ARPU下降?付费渗透下降?付费用户下降等等);

(2)数据收集:

我们数据主要来源于游戏日志,我们可以自己用SQL提取,或者是找数据同事帮助提取,提取之后原始数据,进行加工清洗,找出有用的数据;

(3)可视化展现&数据分析

为了让观看报表的人可以更明晰理解我们的思路,我们会把根因分析的过程用图示列出来选取合适的图表。

比如:看走势用折线,看不同类别用条形图等等;美化图表,选择合适的颜色,字体,等等;进行报告的展现,协同相关人一起分析

(4)解决问题:

根据结论,进行针对性的修改,同时进行数据埋点,下一次再进行数据观察和分析。

最终实现,以数据驱动产品的过程,带动产品更好的发展。


可视化分析应用思路

1、可识别应用效果:

在上述章节,我们说到了美化图表这块,通过以下的视觉属性展示,我们能便捷的识别出目标


2、数据类型分类&应用效果分类

在日常的数据分析中,我们会遇到以下3种分类的数据,不同的数据类型,可以用来强调和区分的效果,参考如下:

(1)分类数据
比如:付费用户,非付费用户。
此类数据可以用:位置,颜色,形状进行区分。

(2)次序数据
比如:优秀,良好,差。
此类数据可以用:位置,大小,颜色,颜色深度,形状进行区分。

(3)量化数据
付费额度:1-10元,10元-50元等等。
此类数据可以用:位置,长度,大小,颜色,颜色深度,方向进行区分,在进行不同的数据对比时,我们需要思考如何更好用到上述的应用效果,进行更明晰的视觉展示:

(图片来源百度)

3、可视化图表&图形选择

我们常用的基本统计图包括:条形,饼图,折线

其他统计图:

堆积,面积(简单的数量比较和变化趋势)
两个维度的散点分布
树型关系

延伸的散点图(简单的点,扩展成图形,分布在散点中),图形或者气泡

堆积图,面积图(用百分比更明晰对比)
复杂的多环饼图

图表建议如下:

(图片来源百度)


实例:图形+效果,更好展现数据。

通过多个柱状图,我们可以同时比较多类别数据比较关系。

增加颜色,效果更直观
增加堆叠条,便于更细分数据。

如下图,是对比不同城市的产品销量,通过堆积图,我们进一步把一个城市的产品销量做了分类。我可以明显的看到,销售量最多的城市,各类物品的销售情况。

当然,如果还想更明晰的看到KPI达成情况,我们还可以增加辅助线。


特殊的有意思的图:

桑基图:特定的流程图的展示,一般我们用漏斗图可以分析一个用户从点击页面,到购买中间,整体的一个环节,但是,中间的一些细节我们关注不到,这时候,就需要用到桑基图,来看一个整体的流程流动情况。


地图可视化

地图可视化可以为我们做什么?只是看上去更炫酷么?

地图便于我们更明晰的找出地区之间数据的差异。

以下是我做的两个示例表:表示每个区域的销售额度,你更喜欢哪一张?


(1)常见地图可视化展示类型:

路径地图:可以用来看台风的路径,如果是吃鸡游戏分析,我们可以用来分析流失用户的地图路径。

蜘蛛地图:

用来看出发地点和一个或多个目的地的相互作用,比如了解地铁运行图。

符号地图:
文章开头的伦敦霍乱图,能了解各个位置的死亡数据。

场景地图:不基于现实生活中的地图,而是基于某个场景位置,比如,我们可以看到商场哪些店铺更热门,超市哪些货架最受关注。

(2)游戏应用场景:
应用于moba类,mmorpg类:我们可以快速知道死亡聚集点,新手流失地点,地图停留时长。

PUBG类游戏:我们可以更快速的知道,死亡聚集点,落点,胜利点,新手流失地点等。

(3)开发难点

地图热力图的内容分为两部分,一个是基于数据计算的热力图,一个是底层地图,然后将两个图层合并成一个才能形成地图热力图。

热力图绘制过程涉及到数据清理、处理、导入绘制,因为不同业务地图尺寸不一致,需要制定一套规则将数据转变的比例确定下来以保证代码通用性,和对原始地图的适配,需要考虑统一数据处理方案;网上热力图组件比较多,但是差异性较大,需要选择合适的数据向图形转换组件,这边我们也是在持续不断探索中。

关于可视化相关的介绍,暂时说到这里,文章很浅显,希望能抛砖引玉,得到更多人的建议和意见。

小彩蛋:我经常看的一些资源:花瓣网  优品PPT  设计素材搜索  阿里巴巴矢量图标库

本文参考了tableau 数据可视化的科学与艺术,部分图例来自与百度,如有侵权,请联系我删除。




 不会做职场时间管理?这些建议你绝对用得上!


如何转型做产品经理?


怎么看运营的前世今生?


腾讯养鸡记


中国人工智能安防峰会


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存