查看原文
其他

七周:第四周数据可视化学习笔记

2017-11-27 订车宝 Python爱好者社区

作者:订车宝

Python爱好者社区专栏作者   汽车数据分析    一站式汽车经销智能运营管理平台

博客地址:https://ask.hellobi.com/blog/cbdingchebao



以下是七周成为数据分析师课程部分学习笔记

(点击阅读全文可学此课程哦)


前文链接:


七周:第一周数据分析师思维学习笔记

七周:第二周业务学习笔记(内附练习汽车经销店整车销售分析模型)

七周:第三周Excel学习


美丽的图表,应该是有用的图表


对于数据可视化,大多数人下意识是要好看,下意识的去追求美感,觉得高大尚。其实,美丽的图表应该是有用的图表。

数据可视化的目的是让数据更高效,让读者更高效的进行阅读,而不是自己使用。好的可视化能突出背后的规律,突出重要的因素,最后才是美观。

故----设计图标要明确目的性



【图表的基础概念】


1.描述分析的角度和属性,分类数据(时间/地理位置/产品类型等)

2.具体参考数据,数值数据(元/销量/销售金额)


【常见图表】


1.散点图-----核心:展现数据之间的规律



延伸----气泡图:散点图的变种,引入第三个度量单位作为气泡的大小

延伸----单轴散点图



常见散点图的应用举例


1)客户消费维度

消费金额和消费次数

消费金额和最后一次距离今天消费天数的关系

消费次数和最后一次距离今天消费天数的关系


2)客户其他消费维度

消费金额和消费折扣的关系

消费金额和会员积分的关系

消费次数和会员距离的关系


3)垂直领域消费维度

投资金额和投资次数的关系(金融)

最近一次距今消费和使用次数(SaaS)


2.折线图

变种----面积图


3.柱形图

变种----直方图/正负比列/瀑布图等



4.饼图



用面积区分大小,很多情况下肉眼是很难区分的,上图为玫瑰图---饼图的变种


5.漏斗图

注意:转化步骤不易太多,太多很难分析出转换因素


6.雷达图




【不常见的高级图表】


1.树形图---适合数据量比较大的情况



经常会和很多分析中的钻取相结合来进行直观表现


2.桑吉图


绘制流量变动最开始,网站的流量,监视用户的行为分析,表示用户在网站上的行为轨迹,一对多或多对一的关系


3.热力图



数据上下波动可用折线图观察,但是中间的某种关系展示揭示特殊关系使用热力图则可看出来。


4.关系图----社交,社会媒体,微博的传播,用户和用户之间的关注等



5.箱线图---揭示分布的规律


6.标靶图(子弹图)----通常与销售业绩KPI目标挂钩



监控KPI达成进度,通常用于部门报告给管理层使用


7.词云图



8.地理图----数据和空间的关系



【图表绘制的工具】


初级---Excel

中高级---编程python,R等


【绘制技巧】


配色:配色网站color.adobe.com



原则:

把需要聚焦的数据进行颜色凸显

去掉多余没有用的元素

横纵辅助线如果对肉眼观察无帮助则去掉

在报告中,内容交给单元格来解决

有设计规范


1.散点图的绘制技巧

呈现出一定规律的散点图可增加趋势线,并通过选项将规律用公式表示出来。

2.辅助列技巧

(1)旭日图举例,环形图延伸进行辅助列嵌套(旭日图对分析没有什么特别的作用,常用于展示的报告中)

(2)漏斗图:逆序类别----辅助列

3.次坐标轴使用技巧

分析思路举例----累计图,某一个活动当时看变化幅度很大,放在累计里面起到微微凸起,说明对整体影响并不强烈。

4.甘特图的画法技巧

日期线使用误差线来画

5.标靶图(子弹图)绘制技巧:步骤详见课程


【杜邦分析法】


制表的好习惯:原始数据(明细表)---中间表---汇总表

其中,原始数据用堆叠表,不要用宽表(宽表数据不易处理)


【可视化工具---Power  BI】


单一图表没有意义,三表成虎,通过多表多因素展现分析。注意设计的表格揭示的是现象?还是原因?

power BI 是一款免费软件,对于初学入门是很好的选择。



操作的时候不建议链接Excel,因为表格本身会自带各种格式,链接会出现很多问题。建议养成好的习惯,用.csv格式链接或者数据库连接。

power BI 的功能特点:

制作的图表可以进行联动

多对对的关系不能进行关联

power BI内的函数使用与Excel的函数应用基本一致,不建议话太多的精力去学power BI里面的函数。

建议使用Excel将数据进行清洗后,再已.csv的形式导入BI内进行操作。

power BI可以引入第三方的一些高级功能(80%都是微软自己的)来满足使用者需求,例如添加更多的图表形式,词云图等等。


【Dashbord的设计】


布局和设计要素:主次分明+贴合场景+指标结构

建议先自己规划好(自己用草稿纸动手去画,思路会更好的捋顺清楚)


1.使用场景布局举例:


考虑是谁在使用?

用户的目的是什么?

是希望进行监控?还是希望分析?

用户怎么使用?

(很多BI是有监控的,看使用人都干什么,使用那些报表,会使用后台监控日志去调整改善BI的布局)


2.指标结构举例



【Dashbord是一个不断迭代的设计过程】-----重实操





天善智能数据分析主打课程,秦路主讲,七周成为数据分析师课程。

思维方法+业务知识+技术手段,全方位打造出高含金量的数据分析师课程

想成为数据分析师么?快来报名学习吧!已经有1600+学员加入学习啦~


点击阅读原文立即学习

Python爱好者社区历史文章大合集

Python爱好者社区历史文章列表(每周append更新一次)

福利:文末扫码立刻关注公众号,“Python爱好者社区”,开始学习Python课程:

关注后在公众号内回复“课程”即可获取:

0.小编的Python入门视频课程!!!

1.崔老师爬虫实战案例免费学习视频。

2.丘老师数据科学入门指导免费学习视频。

3.陈老师数据分析报告制作免费学习视频。

4.玩转大数据分析!Spark2.X+Python 精华实战课程免费学习视频。

5.丘老师Python网络爬虫实战免费学习视频。



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存