BI做表sop
The following article is from 求知鸟 Author 求知鸟
BI日常工作很重要的一部分就是在BI工具上做仪表盘,俗称做表。数据分析四个主题:描述,归因,预测,控制。报表开发主要承担描述业务监控指标作用(也承担维度分拆的归因功能)。
本文梳理报表开发的一般流程:
产品/运营/策划需求发起 BI进行可行性评估 需求排期 数据模型开发 数据校准 BI展示 报表验收 报表上线
1、业务方需求发起
业务方发起需求时,需要提供的信息包括:
背景,目的,业务动作 报表字段和统计口径 更新周期:报表更新周期和生命周期 deadline
对于专题分析需求,业务方没想明白拉着分析师开会讨论,这是没问题的。对于BI报表需求,如果业务方没想明白自己需要什么,那就是偷懒,对于这种行为,BI是可以主动push其进行思考的。
2、BI可行性评估
可以从以下三方面进行评估:
有没有必要做
业务系统是否有报表,比如简道云,业务后台 报表的使用频率够不够高?如果看一次,分析师取数即可 是否有权限控制需求?如果对数据有行列权限需求,走BI靠谱
能不能做
数据获取成本是否高,比如需要看竞品月售,系统没有,需要爬虫就属于成本较高的 技术实现,比如实时看板一般由技术人员实现,分析师提供口径
有无更合适的人
不唯关系论,业务方和谁私交好找谁做表,这是不可取的 业务模块和人天预估共同决定谁更合适,是否需要多人协作
3、需求排期
在考虑报表需求的重要性、紧急程度的同时,还需要对需求方进行预期管理,留够充足的时间。新人通常对需求的"坑"了解不够,对需求预留时间不够,最后需求delay,给人留下不专业的印象。建议新人对需求或者给需求排期时主动请教"师傅”给工作预留足够的安全垫。
此外,为了避免反复沟通以及可能的"背锅",在需求还未开始前,就需要做好文档留存,比如报表的编号,业务线归属,报表中文名称,报表类型,需求方,需求提交日期,预计上线日期,开发负责人,当前进度等。
4、数据模型开发
数据模型开发主要是数仓ETL的职责,随着技术发展,各种便捷工具的出现,比如阿里云dataworks的出现降低了数据模型开发的门槛,很多分析师也可进行模型开发和设计。
通常来说,埋点,交易域等极其重要或较复杂的数据交给数仓做更专业,手工填报或竞品爬虫可以由分析师负责模型开发和维护,前者确定,后者灵活且相对不确定。需要注意的是,无论是数仓还是分析师开发数据模型,都需要对模型质量负责。
需要强调的是:模型开发涉及多部门协作,比如产品-分析-测试-后端-数仓,一定要写好文档,拉会议进行信息同步。
5、数据校准
数据验证主要是核对数据是否准确、完整。一般的方式如下:
自检代码逻辑,字段相互验证; 和其他系统的数据比对验证,比如生产库、三方平台的数据; 由测试人员进行验证;
数据验证阶段,发现的问题通常在以下几个地方:
统计逻辑,比如 隐藏前提,交叉标签等; 数据抽取,比如 数据增量抽取时依赖update_time字段,而该字段在生产库没有同步更新,这种情况下要么改抽取方式为“全量抽取”,要么生产库的字段更新逻辑要进行调整; 生产库改动,比如 生产库的业务逻辑改动(业务分流),或者先前的表的字段已被弃用(不再更新); 业务数据出现重复错乱,比如手工填报数据由于业务方疏忽,同样的数据上传了两条或者本周与上周传的同一粒度的数据不一致。 埋点漏传,想要的数据取不到。
如果数据核对不上,则建议按上述的顺序一一排查。
6、BI展示
BI图表如何选择,可以参考《用数据讲故事》、《Excel图表之道》和《用图表说话:麦肯锡商务沟通完全工具箱》,以及各家BI厂商的用户文档,比如Tableau、国内的帆软,观远,有数,QuickBI等。各厂在降低用户上手难度上都做了蛮多工作,也有BI的操作视频,感兴趣可以百度一下。
值得注意的是,有些用户喜欢看图,有些喜欢看信息密度更高的表,如何在图与表之间进行平衡,特别考察BI。列举常见的一些比较“难”的实现功能点:
需要灵活进行任意时间周期的对比(同环比实现不了) 不同维度,不同指标进行切换对比 维度周期分拆下钻,对GMV下降进行归因 ......
7、报表验收
第5步已经讲过数据验收了,报表验收主要争对以下点进行核查:
维度,指标进行必要的说明备注 页面跳转和维度下钻是否生效 数据显示格式是否恰当 权限是否生效,包括功能模块,文件夹权限,报告权限,行列权限,操作权限(复制导出等) 筛选器是否生效 报表查询时长是否如预期,返回慢则需要进行优化 ......
8、报表上线
BI仪表盘开通,通常需要申请权限,那么报表上线后需要告知业务方报表申请路径(走OA或者发邮件)、报表名称等信息。
此外,BI分析师需要主动跟进业务方是否通过BI看数,看了数据后怎么用,定期反馈优化。
点击这里,阅读更多数据文章!