其他
快手BI大数据分析场景性能优化实践
导读 在信息化时代,大数据已经成为企业决策、市场分析、科研创新等众多领域的核心驱动力。随着数据规模的爆炸性增长,如何高效地处理和分析海量数据,实现性能的显著提升,成为各行各业迫切需要解决的关键问题。本文将为大家介绍快手大数据分析场景性能优化实践。
主要包含五部分内容:1. 快手分析产品介绍
2. 快手分析场景性能挑战
3. 快手分析场景性能优化实践
4. 未来展望
5. 问答环节
分享嘉宾|崔振凯 快手 大数据技术专家
编辑整理|李天赐
内容校对|李瑶
出品社区|DataFun
快手分析产品介绍
1. 快手分析平台的分析能力介绍
02
快手分析场景性能挑战
性能分析难:不清楚耗时在哪个环节,平台对用户来说是黑盒的;不了解数据消费用户的查询特征;性能波动难以归因。 优化门槛高:需要很强的知识背景,很强的专业领域性,而分析用户通常是小白用户无法自己进行分析和优化。
分析复杂度高:30% 以上的复杂分析,包含同环比、占比、LOD 分析等; 引擎查询复杂度高:关联查询多、数据量大,查询时间范围大; 引擎局限性:当前快手主要的引擎是 ClickHouse,其对关联查询不友好,SQL 优化不智能。(每个引擎都有其自身局限性)
03
快手分析场景性能优化实践
1. 打法策略
2. 确定目标
3. 确认团队
4. 性能分析
5. 解决方案
(1)分析平台性能优化-缓存预热
(2)分析平台性能优化-查询优化
复杂分析查询下推:占比或者同环比这些复杂分析,尽量转换成一个完整的 SQL 下推执行; 谓词下推; 聚合算子优化; JOIN 顺序调整。
(3)分析平台性能优化-物化加速
6. 引擎的性能优化-湖仓一体 OLAP 引擎 Bleem
04
未来展望
05
问答环节
Q2:Bleem 在生态圈里属于哪一层?
分享嘉宾
INTRODUCTION
崔振凯
快手
大数据技术专家
快手分析平台大数据技术专家,在快手从事分析产品研发与性能优化工作,加入快手前从事数据服务化和大数据二次开发工作。在大数据和 BI 领域有较为丰富的开发和实践经验。
往期推荐
点个在看你最好看