数据科学必备技能:如何用Power BI做数据可视化
今日份知识你摄入了么?
“当一张照片能让我们注意到意想不到的东西时,这才是它的最大价值。”
— 约翰·图基
数据可视化指的是用图形表示信息和数据。通过使用图表、图形和地图等视觉元素,数据可视化工具让数据分析师方便解释和了解数据中的趋势、异常和模式。
在大数据和大量信息需要处理的背景下,数据可视化软件应运而生,成为了一种必不可少的工具,使数据分析师能够以更简单、更快的方式深入了解他们正在处理的数据。
图片来源:Pexels摄影:Lukas
其他可用于实现相同目标的工具也包括编程,我们能够通过编程构建更灵活、更专属的功能,但这类个性化可视化花费的时间也更长。
在本文中,我整理了一份关于如何用 Microsoft 的商业分析服务 Power BI 来做数据可视化分析的详尽指南。接下来,请跟我一起在实践中探索!
目录:
1. Power BI 简介。(阅读 2 分钟)
2. 为什么要使用Power BI?(阅读 2 分钟)
3. 绘图类型(阅读 5 分钟)
1.简介
Introduction
Power BI 是 微软(Microsoft) 的一项商业分析服务,旨在提供交互式可视化和商业智能功能,它的界面足够简单,让终端用户可以创建自己的报告和图表。
从本质上讲,Power BI由一组软件服务、应用程序和连接器组成,通过协同工作,将不相关的数据源转变为连贯和交互式的解析。数据可以存储在 Excel 中,也可以储存在基于云的环境或数据仓库中,并且都可以从 Power BI 访问,以便分析。
Power BI 由一组协同工作的应用程序组成,可用于创建并得到商业解析。以下三种最为常见:
Windows 上的Power BI桌面应用程序。
Power BI 服务的在线软件服务。
适用于 Windows、iOS 和 Android 设备的 Power BI 移动应用。
使用 Power BI Desktop 创建的示例仪表板
在Power BI 中常见的工作流首先会连接到数据源并生成报表。之后,发布这个报表到 Power BI 服务,与其他用户共享,这样,其他用户也能查看该报表并反馈。
首先,你可以点击此链接下载 Power BI Desktop 应用程序,点击后,将跳转至 Microsoft Store页面。
2. 为什么要使用Power BI?
Why should you use it?
下载应用程序后,就可以开始使用了。进入应用程序后,你会先看到主画布,可以通过拖放系统至画布,实现数据探索可视化。该系统支持大范围现代可视化中选择绘图类型,并轻松地从导入的数据中选择数据特征文件或数据库。
Power BI 的一大功能,是它支持提取和连接不同来源的数据,这与像 Excel 、 PowerPoint 这类其他 Microsoft Office 软件包工具相反:
它不仅有多个数据源,而且还允许来自不同来源的数据在探索过程中进行交流,以获得进一步的解析。
这个功能可以通过“主页(Home)”的菜单栏完成,选择获取数据(Get Data)。其中有些信息非常有趣,他们来自于 excel 、CSV 文件、Access、Oracle、Azure SQL 和 MySQL 数据库、Spark 和 Hive、Salesforce、GitHub 甚至 Python 脚本,都可与你的脚本进行交流。
Power BI 还有一个功能非常有趣,即自动刷新已存储的数据,以促进日常分析任务,例如内部的商业报告。
另一方面,除了提供多种多样的图表类型(例如折线图、条形图、饼图和堆积条形图)外,Power BI 还包括一个市场,可以在其中找到专属且复杂的图表类型。
3. 图表类型
Plot Types
A. 面积图(Area Chart)
面积图,也称为分层面积图(layered area chart),是一种图表类型,用来表示一个或多个数量随时间的变化,它显示数据的方式类似于折线图,增加了变量体积的可视化。
当你想表示一个变量随时间变化的趋势,但数值不用非常精确时,面积图是一个不错的选择,例如:公司全年的销售额、支出费用以及员工的生产力变化。
为了得到上面的图表,我们要从可视化面板中选择面积图,并将所需的值和轴拖到画布上。
B. 条形图(Bar Charts)
在 Power BI 中生成这类图表,我们要从可视化面板中选择条形图。
条形图示例
当我们将所需的值和轴拖到画布上后,我们就可以继续设置图像的样式,包括修改标题、标签、背景颜色、条形颜色以及其他功能。
C. 组合图(Combo Chart)
组合图是将折线图和柱状图组合在一起的单个可视化图表。当折线图和条形图使用同一X轴,且比较不同值范围的多个度量时,组合图是一个不错的选择。此外,组合图有助于在同一可视化图表张比较两个度量之间的相关性。
在下图中,我准备了一个示例图,其中显示了总销售额(左 Y 轴以百万为单位)与每个产品的平均价格(右 Y 轴以美元为单位)之间的关系,并区分了销售额的链条:
组合图示例
在 Power BI 中生成这种类型的图表,我们需要从可视化面板中选择折线图和堆积柱形图,“横轴”表示月份,用非常明显的特征强调条形图中的“条形”,在本例中是“链条”。“列”代表销售额和平均单价,通过折线图与总销售额进行比较。
D. 环形图(Doughnut Charts)
环形图类似于饼图,因为它显示了每个部分和整体的关系。唯一的区别是,中心是空白的,为标签或图标留出空间。
下面图中,我准备了一个示例图,其中显示了品牌连锁店之间的总销售额分布:
示例圆环图
为了在 Power BI 中生成这种类型的图表,我们要从可视化面板中选择“圆环图(Donut Chart)”,并按月份设置“图例”、将销售总额信息拖动到“值”。之后,你可以根据自己的需要或喜好进行自定义。
在选择此图表实现可视化之前,请记住,圆环图的各个值加起来必须为 100%,而且,类别过多的话会导致难以阅读和理解。
E.漏斗图(Funnel Charts)
漏斗图通常用于展示流程的顺序连接阶段。最常见的应用场景是销售流程,因为它们可以显示每个阶段的潜在收入金额,并帮助公司识别许多潜在问题领域。
每个漏斗阶段代表总数的百分比。因此,在大多数情况下,漏斗图的形状像漏斗——第一阶段最大,随后的每个阶段都比前一个阶段小。
示例漏斗图
在以下这些情况中,漏斗图是一个不错的选择:
数据是连续的,并且至少经过几个阶段。
据估计,第一阶段的数量会大于后续阶段的数量。
我们想分阶段计算潜在收入。
为了在 Power BI 中生成这种类型的图表,我们要从可视化面板中选择漏斗图,并用流程的不同阶段完成“组(Group)”的内容,并将销售总额信息拖到“值(Values)”,让它们在各个阶段之间进行分配。之后,你可以根据自己的需要或喜好继续自定义图表。
F. 径向测量图表(Radial gauge charts)
径向图表有一个圆弧,会显示单个的值,用于衡量目标或关键绩效指标 (KPI) 的进度。线(或针)会代表目标或目标值,阴影代表该目标的进度。弧内的值代表进度值。
本例中,我比较了今年到目前为止的总销售额与往年平均总销售额,每年大约 9000 万,而年初这个数字为 4500 万。
径向图表示例
径向图表是显示目标进度、表示百分位度量(如 KPI)、甚至显示单个度量运行状况的绝佳选择。
为了在 Power BI 中生成这种类型的图表,我们要从可视化面板中选择仪表图(Gauge Chart),并使用要实现的所度量填入“目标值(Target Value)”和要比较的实际数字的“值(Value)”。
此外,你还可以手动设置最小值和最大值。之后,你可以根据自己的需要或喜好自定义图表。
总结
Mid-Autumn Festival
通过本文中列举的指南和绘图类型,我希望能帮助你提高使用 Power BI 实现可视化的能力。
如果你喜欢本文包含的信息,请随时与我们联系,分享你的想法。如果你有任何问题或想法要分享,欢迎在文章下方留言、讨论,或者你可以在社交网络中找到我以获取更多相关内容。
原文作者:Julian Herrera
翻译作者:Lia
美工编辑:过儿
校对审稿:Jiawei Tong
原文链接:https://towardsdatascience.com/business-intelligence-visualizations-with-power-bi-fcc4ccc5a906
本周公开课预告
往期精彩回顾
点击“阅读原文”查看数据应用学院核心课程