AI+BI+可视化,Sugar BI架构深度剖析
本次技术分享,将以 Sugar BI 为示例,分析背后的技术架构与流程,以及可视化图表的智能推荐策略等功能的设计思路,帮助大家深入理解智能化可视化 BI 的技术与实践。本次内容主要分为以下 4 个部分:Sugar BI 产品的整体概况、可视化技术分析、智能图表推荐、智能语音交互。
在产品报表的主编辑页面,所有的组件都是拖拽式的。
使用拖拽字段的方式进行数据绑定、全界面化的添加和修改图表组件,简单易用。
丰富的图表配置项,可以让用户零门槛上手。
移动端报表布局自动适配,可以让用户随时随地多端查看 Sugar BI 产品。
帮助真正懂业务的人完成分析。
开放性的数据库:MySQL、SQL Sever、 Postgre SQL、Oracle 等。
零代码:可以做到用户不需要写任何的 SQL 语句。
可以根据不同的数据源抹平其中不同数据库之间 SQL 语句的差异。
可以在获取数据表字段的时候会自动形成维度和度量的差别,还会自动取识别地理字段。识别策略主要有两种:
第一种是根据字段的数据类型,例如如果是字符串、日期会自动生成维度;如果是整数、小数等会自动生成度量。
第二种是根据字段名称、数据内容进行识别,类似 ID、type 类型、注释,从而在维度和度量的自动生成上做一个智能的区分,如果写的是省份 province / city,Sugar BI 会根据词性猜测字段为地理字段,不过用户也可以将维度和度量之间任意转换。
可以对度量进行常规的聚合操作,其中包括 Sum,Average,Max,Min 等。
查询 Field 3、Field 6
查询 Field 3、Field 13
查询 Field 7、Field 13
数据格式转换
日期时间的聚合计算
计算字段
分桶分组
数据值映射
交叉透视表
合计、均值
表计算、快速表计算
数据缓存:可以利用 Redis,确保同一个SQL 只执行一次。每一次执行的结果,Sugar BI 可以帮助执行结果进行缓存,从而达到较好的性能效果。
针对不同数据源的特殊优化:如 ClickHouse 的留存计算 Retention,通过调取不同数据源特有的功能函数去实现特有的功能。
异步多线程的表计算。
计算输入字段特征和图表特征对字段需求的相似程度
和日期字段有关的规则:例如根据日期的字段,系统可能会优先推荐折线图。因为折线图比较适合展现日期上面的波动情况。
和度量单位有关的规则
归因分析:指某一指标发生的较大的变动时,能够帮用户自动找到是哪些维度引起的,每个维度的分别影响的贡献度是多少,都可以通过归因分析来进行量化。该功能目前已上线。 异常分析:指的是数据发生剧烈变化时需要找到原因,后续会和归因分析一起进行。异常分析一般都是系统主动分析然后自动地将异常报出来,不需要用户单独去进行操作。所以会结合数据预警,出现异常的时候就主动给用户发预警。该功能目前已上线。 预测分析:指的是在历史数据的基础上,利用机器学习、AI 算法等一些策略,支持业务人员对后续的数据走势做出一定的预测。这样 Sugar BI 就能更好的帮助用户总结过去、展望未来,为用户的决策做更好的数据支撑。