【案例分享】Apache Kylin在国美在线的应用
双十一每年都是检验各个公司技术平台实力的重要时刻,在今年,使用Apache Kylin构建的国美在线大数据查询系统稳定的支持了双十一3天的海量查询需求,“非常稳定的度过,数据查询上完全没掉链子”,国美在线大数据平台经理,路加评价道,在11月25-26日的World Of Tech 2016 大数据技术峰会上,路加进行了题为“Apache Kylin在国美在线的应用”的分享,介绍了Apache Kylin在国美的应用,选型过程及技术架构等,同时也分享了双十一三天的查询性能、热力图应用等内容,是非常不错的的Apache Kylin应用案例参考
Apache Kylin公众号近日也获得授权分享这则案例,希望对您有所帮助。
在此感谢路加先生的精彩分享。
讲师介绍
姓名:路加
职位:大数据平台部经理
公司:国美在线
简介:2012年硕士毕业于东北大学,曾在华为2012实验室-香浓实验室进行情景感知平台的研发工作,2014年加入国美在线,主要负责大数据平台的建设,目前重点关注在OLAP分析平台的开发和管理工作,助力公司的数据化运营。
国美大数据
国美大数据平台:
国美大数据平台架构:
大数据OLAP的挑战:
• 百亿级的数据规模
• 维度和指标的需求变化
• 问题数据修复
• 查询效率
Apache Kylin的引入
• 高效查询
• 保持现有组件
• JDBC接口
• 完整性组件
• 交互界面
Model & Cube:
Job Monitor:
Insight:
Apache Kylin架构:
Apache Kylin基本原理:
Apache Kylin的OLAP分析平台实践
Cube优化:
• 减少膨胀率
• 提高查询效率
• 减少cube构建的时间
•Aggregation Groups
• Mandatory Dimensions
• Hierachy Dimensions
• Joint Dimensions
includes中的所有维度=
Mandatory Dimensions + Hierarchy Dimensions + Joint Dimensions
Apache Kylin的引入:
• Rowkey的顺序
• Segment合并
遇到的坑:
• Segment无法拆分
• 非星型模型的关联查询
• 版本升级
• Job Server单节点
Kylin待发展的方面:
• 高基维度的查询支持
• 丰富聚合函数
• 明细查询
• 非星型模型的支持
实际案例
双11三天的查询统计:
全站热力图:
点击热力图:
总结
• Kylin的输入是星型模型
• Kylin暴露的是Hive的元数据
• Cube优化是用好Kylin的重点
您可能还会想看:
云中麒麟 – Apache Kylin在微软Azure上的实践