【Strata Data预告】Apache Kylin 2.0：从Hadoop上的OLAP 引擎到实时数据仓库

apachekylin 2022-04-23

7月12日-15日，全球最顶尖的数据大会Strata Data Conference将再次来到北京！Kyligence技术合伙人兼高级软件架构师，Apache Kylin Committer & PMC Member李栋讲师，也将现身大会为听众朋友们带去一场干货演讲！

演讲主题：Apache Kylin 2.0：从Hadoop上的OLAP 引擎到实时数据仓库

讲师：Dong Li (Kyligence)

11:15–11:55 Saturday, 2017-07-15

数据工程和架构 (Data engineering and architecture)

地点：紫金大厅B（Grand Hall B)

观众水平 (Level): 中级 (Intermediate)

必要预备知识

了解Hadoop基本原理，了解OLAP基础知识

您将学到什么

对以Kylin为代表的预处理数据类数据引擎的理解，启发观众从不同的角度思考如何面对不断升级的规模数据的挑战

描述

Apache Kylin v2.0即将发布！作为领先的大数据OLAP分析引擎，现在的Apache Kylin羽翼更丰：支持雪花模型、更加全面的SQL语法、初出茅庐的Spark Cubing、更好地支持实时流式数据接入等等。Apache Kylin正逐渐从一个Hadoop上的传统OLAP平台，演变为一个Hadoop上的实时数据仓库。本演讲将介绍Apache Kylin v2.0带来的最新特性，以及它们背后的技术架构和设计理念：

自v1.5起，Apache Kylin就支持通过micro-batch加载Kafka数据，实现了分钟级的准实时分析。到v2.0，Apache Kylin对Kafka数据源的支持更加稳定和友好，用户可以在同一个平台对流式数据和历史数据进行分析。

在过去，Apache Kylin只支持星型数据模型，给部分应用带来了局限。从v2.0开始，Apache Kylin将支持雪花模型，用户无需进行模型转换，就可以直接按现有数据模型在Kylin中建模，这使得Kylin可以更容易地应用在复杂案例当中。

预计算类分析平台意味着离线的数据预处理过程。对Apache Kylin而言，这个过程就是Cube的构建（Cubing），我们尝试使用Spark对现有的构建引擎进行大幅改进，并且收获了不错的初期结果。

Apache Kylin对SQL语法的支持也在不断改进，如支持时间函数、窗口函数、百分位等复杂函数。这些改进的需求起源于社区，也最终由社区的力量推动而实现。

区别于其他的SQL on Hadoop技术，Apache Kylin始终专注于尽量使用离线预计算替代在线计算。在这个数据规模日益激增的时代，如果希望以稳定的性能面对各类规模的数据挑战，Apache Kylin或许才是你的首选！

讲师介绍：

Dong Li (Kyligence)

Kyligence技术合伙人兼高级软件架构师，Apache Kylin Committer & PMC Member，专注于大数据技术研发，KyBot技术负责人。毕业于上海交通大学计算机系；曾任eBay全球分析基础架构部高级工程师、微软云计算和企业产品部软件开发工程师；曾是微软商业产品Dynamics亚太团队核心成员，参与开发了新一代基于云端的ERP解决方案。

除了干货预告，Kyligence还为大家准备了一大波的折扣码！

就是下图这个码，有购票需求的童鞋们在今天动动手指把二维码扫起来，然后输入：KYLIGENCE，就能以惊喜折扣价购北京站门票啦~

（文章转载自OReillyData）

更多详情点击阅读原文获取。

"Apache and Apache Kylin are either registered trademarks or trademarks of The Apache Software Foundation in the US and/or other countries. No endorsement by The Apache Software Foundation is implied by the use of these marks."

您可能还会想看

【技术帖】Apache Kylin 2.0为大数据带来交互式的BI

【预告】AWS云创沙龙 | Kyligence受邀分享基于Apache Kylin的云上大数据分析

【技术贴】使用Apache Kylin和AWS EMR进行云上大数据OLAP分析

【KyBot】KyBot 现已支持Apache Kylin知识库和工单系统

【技术帖】Apache Kylin高级设置：必要维度（Mandatory Dimension）原理解析

【技术帖】Apache Kylin 高级设置：层级维度（Hierarchy Dimension）原理解析

【技术帖】Apache Kylin 高级设置：联合维度（Joint Dimension）原理解析