查看原文
其他

【干货,附PPT】:Apache Kylin v2.x最新特性分享

apachekylin 2022-04-23

查询下压(Query Pushdown)功能、全面支持雪花模型、Spark构建引擎……对于广大用户满心期待的Apache Kylin v2.x新特性,Apache Kylin Committer & PMC Member、Kyligence高级架构师李栋在7月15日的Strata北京峰会上一一做了解读。

Apache Kylin Committer & PMC Member、Kyligence高级架构师李栋,在7月15日的Strata Data Conference(下称Strata峰会)北京站发表了《Apache Kylin v2.x:从Hadoop上的OLAP引擎到数据仓库》的专题演讲。


李栋在Strata峰会发表演讲


Strata峰会是全球公认的世界最顶级的大数据会议,被《福布斯》杂志誉为“大数据运动的里程碑”。峰会上,李栋介绍了Apache Kylin新一代v2.x版本的最新特性,例如即将在v2.1版本发布的查询下压(Query Pushdown),以及在v2.0版本已经全面支持的雪花模型、Spark构建引擎等。这些特性使Apache Kylin可以支持更加复杂的数据模型和灵活的业务场景,推动Apache Kylin从Hadoop上的OLAP分析引擎到数据仓库的演变。以下是李栋演讲的部分PPT实录:


通过展示Apache Kylin的架构图与性能测试图,李栋为大家阐释了Kylin是什么。


对比数据显示,作为SQL on Hadoop的OLAP分析引擎,Apache Kylin的响应速度远比其它引擎快,关于这一点,从Kylin遍布全球的200多名用户中就可以得到验证。


Kylin采用“空间换时间”的思路,通过预计算构建Cube以实现秒级甚至亚秒级的查询性能。


不过,在Apache Kylin v1.x的时代,Apache Kylin只支持预先定义的SQL查询,当Cube不能满足查询时则查询失败。


在即将发布的v2.1版本中,Kylin将通过查询下压(Query Pushdown)功能解决以上难题。


此外,Apache Kylin从v2.0版本开始就已全面支持雪花模型。


一项基于TPC-H进行的基准测试显示,Apache Kylin对所有查询均能成功执行,并且明显体现了预计算的查询优势。


同时,Apache Kylin v2.0版本所支持的Spark 构建引擎大幅度提升了Cube预计算过程的效率。



作为领先的大数据OLAP分析引擎,现在的Apache Kylin羽翼更丰:查询下压支持用户进行更加灵活的业务分析,给Apache Kylin带来了从MOLAP到HOLAP的转变;加上对复杂数据模型的支持和Spark构建引擎的引入,Apache Kylin正逐渐从一个Hadoop上的传统OLAP平台向数据仓库演变。在这个数据规模日益激增的时代,Apache Kylin始终专注于尽量使用离线预计算替代在线计算,用最小的成本带来最快的数据分析体验。



更多信息请点击阅读原文


 "Apache and Apache Kylin are either registered trademarks or trademarks of The Apache Software Foundation in the US and/or other countries. No endorsement by The Apache Software Foundation is implied by the use of these marks."


您可能还会想看


Apache Kylin优化利器KyBot: Rowkey一键优化

【案例分享】唯品会海量实时OLAP分析技术升级之路

【技术帖】Kylin v2.0 Spark Cubing优化改进

【技术帖】使用KyBot寻找Apache Kylin离线构建瓶颈

【技术帖】Apache Kylin支持Query Pushdown

How to register KAP as a system service by systemd?

【技术帖】Apache Kylin 深入Cube和查询优化

【Strata Data预告】Apache Kylin 2.0:从Hadoop上的OLAP 引擎到实时数据仓库


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存