查看原文
其他

如何将枯燥的大数据,呈现为可视化的图和动画?

李启方 数据分析不是个事儿 2022-07-01



这个问题,其实涉及到一门庞大而又有趣的学科——数据可视化

关于数据可视化,做数据分析或者大数据的人估计都知道,最先想到的就是图表,把数据变成图表不就是可视化吗?

当然这样理解是绝对没有问题的,但是太狭隘、太局限
可视化的概念非常广泛,除了图表之外,凡是可以帮助用户理解数据的手段都可称为数据可视化
而怎么把枯燥的大数据进行可视化,远远不是做几张图那么简单
一个优秀的可视化一般需要满足三个条件:信、达、雅

所谓的信就是要保证数据的正确性;

达即是要让用户轻松接收到数据信息,能够对数据进行有效的表达;

雅即是要保证可视化的美观;

可视化原则

 

从重要程度上看,信>达>雅

想要做出完美的可视化,最最重要的就是要保证数据的准确性,在表达上要准确无误,不能带来一些歧义的地方。
比如说关键数据的缺失、指标与维度的谬误等等,这些因素都会导致我们的可视化失去了最本质的意义:反应数据的真实情况
比如2014年巴西世界杯半决赛,东道主巴西对阵德国战车的全场数据统计,就是典型的关键信息缺失造成了“信”的误判

所谓的达,就是要让用户准确获取可视化所传递出的信息,而不能造成认识困难和信息接收障碍
这个问题经常是一些不注重可视化表达的人,做完数据分析就简单拉个图,也不管对方是否能看懂,这就是缺失了可视化的达
通常来说犯的毛病就是图表过于沉重、繁琐,图标选择不正确,不注重用户体验等等

比如地铁图,如果我们按照普通的可视化地图绘制方法,根据不同的距离方向进行绘制,地铁图就会出现这样的情况:

一些地铁站密集的地方都拥挤在了一起,不利于用户去获取地铁站的信息;
所以我们做地铁图一般都是将地铁站进行等距离、单方向处理,也就是这个样子:

最后一个要素是雅,通俗点说就是要做的好看,这个要素也有很多人会犯很多的误区,一方面是很多人觉得好看没什么用,另一方面则相反过度注重可视化的美观度。
首先我的观点,可视化的主要目的是为了让用户准确高效的获取信息,这才是可视化最关键的要素,美观程度只能是锦上添花,如果没有了前两个要素,过度注重美观也是没有任何意义的,皮之不存毛将焉附?

可视化方法

 
制作可视化报告的方法有很多,最常见的Excel就能做,不过Excel的缺陷在于不能支持大数据量,数据量一大就卡
如果是代码大佬的话可以用python或者Echarts做,可视化效果很惊艳
但是对一般的业务人员来说为了做个报告去学python,代价太大了,所以我推荐技术小白使用BI工具来做可视化报告,操作简单,上手快,这里我以国内用的比较多的FineBI来给大家演示一下可视化分析报告的制作过程。
用FineBI做可视化报告流程主要分为5步:
  • 连接/导入数据
  • 数据处理/清洗(过滤、筛选、新增公式列)
  • 探索式分析
  • 数据可视化
  • 输出报告





1、数据连接

通常我们用Excel做业务分析,需要从公司的各个系统取数,导出成Excel表,然后再进行一系列的分析操作
如果用FineBI的话就省去了这部分取数的麻烦活儿,它可以直接和公司的各种类型的数据库直接链接,也可以手动导入Excel数据集
数据库链接完成之后,新建业务包,然后把需要数据表从数据库添加到业务包中:
2、数据加工处理
数据拿到手之后,我们要对数据进行加工,进行脏数据清洗和一些数据指标的计算,可能要对数据进行过滤、分组汇总、排序、合并等操作
一般用Excel操作就需要写一大堆函数来实现,要是途中有哪一步操作失误,有可能就要一步步倒回去检查,重新再来一遍
不过在FineBI中是通过自助数据集来进行数据加工的,最大的好处是每一步的操作都会被记录,可以随时随地检查每一步的操作,直接进行修改,不需要一步步撤回

3、探索式分析

刚才上面也说了,单纯的数据陈列对领导来说没有意义,管理者更想看到通过对某项业务指标数据的分析得出可行性的结论
在FineBI中,进行数据可视化分析的过程比较简单,拖拽就可以生成可视化图表,非常适合业务人员进行探索式分析
4、数据可视化
经过上面的探索分析,我们基本可以知道我们需要在报告上展示哪些指标,要表达哪些数据
这时候我们就要选择合适的图表来展现数据,比如线形图最适合表现与时间有关的趋势,亦或是两个变量的潜在关系,当数据集中的数据点过多时,使用散点图进行可视化会比较容易,直方图展示数据的分布等等
一般的新手小白在图表选择上会纠结很长时间,还容易选不对合适图表,如果用FineBI做就容易多了,它会根据你拖拽到横纵轴的指标数量智能推荐图表,还有进行纬度和指标数量的提示,帮助快速找到合适的图表

5、可视化报告制作

可视化报告的制作主要分这几部分:可视化布局、图表配色、细节修饰
(1)可视化布局
可视化设计的页面布局,要遵循以下三个原则:

  • 聚焦:通过排版布局,把重点指标放在核心区域,让观看者能够迅速解读关键信息
  • 平衡:要合理的利用可视化的设计空间,在确保重要信息位于可视化空间视觉中心的情况下,保证整个页面的不同元素在空间位置上处于平衡,提升设计美感。
  • 简洁:在可视化整体布局中不要使用过于复杂的元素以免影响数据呈现。

可以从网上找一些模版进行参考,不过Finebi里面也内置了很多demo可以参考
(2)图标配色
颜色是最有效的美学特征之一,很容易吸引我们的注意力,所以一份优秀的可视化报告,图表颜色的使用也非常重要,一般来说,图表配色要遵循几个一致性:
  • 数值指标一致性:当根据某一个指标的数值大小进行颜色映射时,建议使用生长色系的渐变颜色。

  • 指标颜色一致性:对于相同的度量尽量使用同一色系的颜色方案,避免使用过多的颜色对用户造成干扰。
  • 色系颜色一致性:尽量选择相同色系的颜色方案,避免撞色。
  • 语义颜色一致性:符合语义的颜色可以帮助人们更快地处理信息,尽量根据指标含义选择符合人类最直观感受的颜色。

总结

 
想用FineBI这样的神器做出高颜值的动态报表并不是难事,难的是如何充分利用好这些繁多的功能,针对业务找到关键指标和数据,让老板一眼就能看到报表的价值所在,才这是我们应该追求的目标
PS:点击左下角“阅读原文”即可获得FineBI的下载链接!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存