其他
AI+BI+可视化,Sugar BI架构深度剖析
The following article is from 百度智能云技术站 Author ZJ
导读
introduction
01
1.1 百度智能云大数据体系产品架构全景
百度智能云大数据产品架构全景图共三层:底层:通过湖仓数据基础设施(包括湖仓引擎和治理开发)为企业提供数据存储、数据处理、数据开发等能力。中层:数据价值挖掘平台,充分利用百度智能大数据技术,实现企业数据资产价值最大化。顶层:基于底层和中层的技术,帮助各行各业落地大数据应用落地。除此之外,在架构图的右侧我们可以看到,百度智能云大数据体系建立了数据安全防护体系,如:多方安全计算、数据审计、加密脱敏等把控数据安全。Sugar BI 作为数据价值挖掘平台之一,它是数据与用户最直接的一个连接。△图 1 百度大数据体系产品架构全景图
1.2 快速搭建专业化BI分析平台
△图 2 Sugar BI 可视化页面搭建流程
1.3 对接多种数据源
△图 3 Sugar BI 支持的数据源类型
1.4 零代码+拖拽式制作报表
在产品报表的主编辑页面,所有的组件都是拖拽式的。 使用拖拽字段的方式进行数据绑定、全界面化的添加和修改图表组件,简单易用。 丰富的图表配置项,可以让用户零门槛上手。 移动端报表布局自动适配,可以让用户随时随地多端查看 Sugar BI 产品。 帮助真正懂业务的人完成分析。
△图 4 Sugar BI 大屏展示
1.5 自动分析:你准备数据,我生成报表
△图 5 Sugar BI 自动分析功能展示
02
2.1 Sugar BI 架构——有AI特色的可视化+BI分析平台
△图 6 Sugar BI 架构图
2.2 BI 能力:数据模型+灵活交互+数据计算
△图 7 Sugar BI “数据模型+灵活交互+数据计算”能力展示图
开放性的数据库:MySQL、SQL Sever、 Postgre SQL、Oracle 等。 零代码:可以做到用户不需要写任何的 SQL 语句。 可以根据不同的数据源抹平其中不同数据库之间 SQL 语句的差异。 可以在获取数据表字段的时候会自动形成维度和度量的差别,还会自动取识别地理字段。识别策略主要有两种:
第一种是根据字段的数据类型,例如如果是字符串、日期会自动生成维度;如果是整数、小数等会自动生成度量。
第二种是根据字段名称、数据内容进行识别,类似 ID、type 类型、注释,从而在维度和度量的自动生成上做一个智能的区分,如果写的是省份 province / city,Sugar BI 会根据词性猜测字段为地理字段,不过用户也可以将维度和度量之间任意转换。
可以对度量进行常规的聚合操作,其中包括 Sum,Average,Max,Min 等。
△图 8 Sugar BI 数据模型:零 SQL 代码,用户使用更简单
查询 Field 3、Field 6
查询 Field 3、Field 13
查询 Field 7、Field 13
△图 9 Sugar BI 数据雪花模型图
△图 10 Sugar BI 数据筛选示例图
△图 11 Sugar BI 聚合查询后的 Having 筛选示例图
△图 13 Sugar BI 图表联动、下钻
数据格式转换 日期时间的聚合计算 计算字段 分桶分组
数据值映射
交叉透视表 合计、均值 表计算、快速表计算
数据缓存:可以利用 Redis,确保同一个SQL 只执行一次。每一次执行的结果,Sugar BI 可以帮助执行结果进行缓存,从而达到较好的性能效果。 针对不同数据源的特殊优化:如 ClickHouse 的留存计算 Retention,通过调取不同数据源特有的功能函数去实现特有的功能。 异步多线程的表计算。
03
3.1 智能图表目的
3.2 智能图表推荐流程
△图 14 Sugar BI 智能图表推荐流程图
3.3 图表特征设计
△图 15 Sugar BI 图表特征设计
3.4 推荐策略
3.5 规则设计
计算输入字段特征和图表特征对字段需求的相似程度 和日期字段有关的规则:例如根据日期的字段,系统可能会优先推荐折线图。因为折线图比较适合展现日期上面的波动情况。 和度量单位有关的规则
△图 16 Sugar BI 推荐策略
04
4.1 语音问答整体方案
△图 17 Sugar BI 智能语音交互的整体方案示例图
05
5.1 BI 分析的趋势
归因分析:指某一指标发生的较大的变动时,能够帮用户自动找到是哪些维度引起的,每个维度的分别影响的贡献度是多少,都可以通过归因分析来进行量化。该功能目前已上线。 异常分析:指的是数据发生剧烈变化时需要找到原因,后续会和归因分析一起进行。异常分析一般都是系统主动分析然后自动地将异常报出来,不需要用户单独去进行操作。所以会结合数据预警,出现异常的时候就主动给用户发预警。该功能目前已上线。 预测分析:指的是在历史数据的基础上,利用机器学习、AI 算法等一些策略,支持业务人员对后续的数据走势做出一定的预测。这样 Sugar BI 就能更好的帮助用户总结过去、展望未来,为用户的决策做更好的数据支撑。
△图 18 BI 分析的趋势
END