【Strata Data预告】Apache Kylin 2.0:从Hadoop上的OLAP 引擎到实时数据仓库
7月12日-15日,全球最顶尖的数据大会Strata Data Conference将再次来到北京!Kyligence技术合伙人兼高级软件架构师,Apache Kylin Committer & PMC Member李栋讲师,也将现身大会为听众朋友们带去一场干货演讲!
演讲主题:Apache Kylin 2.0:从Hadoop上的OLAP 引擎到实时数据仓库
讲师:Dong Li (Kyligence)
11:15–11:55 Saturday, 2017-07-15
数据工程和架构 (Data engineering and architecture)
地点: 紫金大厅B(Grand Hall B)
观众水平 (Level): 中级 (Intermediate)
必要预备知识
了解Hadoop基本原理,了解OLAP基础知识
您将学到什么
对以Kylin为代表的预处理数据类数据引擎的理解,启发观众从不同的角度思考如何面对不断升级的规模数据的挑战
描述
Apache Kylin v2.0即将发布!作为领先的大数据OLAP分析引擎,现在的Apache Kylin羽翼更丰:支持雪花模型、更加全面的SQL语法、初出茅庐的Spark Cubing、更好地支持实时流式数据接入等等。Apache Kylin正逐渐从一个Hadoop上的传统OLAP平台,演变为一个Hadoop上的实时数据仓库。本演讲将介绍Apache Kylin v2.0带来的最新特性,以及它们背后的技术架构和设计理念:
自v1.5起,Apache Kylin就支持通过micro-batch加载Kafka数据,实现了分钟级的准实时分析。到v2.0,Apache Kylin对Kafka数据源的支持更加稳定和友好,用户可以在同一个平台对流式数据和历史数据进行分析。
在过去,Apache Kylin只支持星型数据模型,给部分应用带来了局限。从v2.0开始,Apache Kylin将支持雪花模型,用户无需进行模型转换,就可以直接按现有数据模型在Kylin中建模,这使得Kylin可以更容易地应用在复杂案例当中。
预计算类分析平台意味着离线的数据预处理过程。对Apache Kylin而言,这个过程就是Cube的构建(Cubing),我们尝试使用Spark对现有的构建引擎进行大幅改进,并且收获了不错的初期结果。
Apache Kylin对SQL语法的支持也在不断改进,如支持时间函数、窗口函数、百分位等复杂函数。这些改进的需求起源于社区,也最终由社区的力量推动而实现。
区别于其他的SQL on Hadoop技术,Apache Kylin始终专注于尽量使用离线预计算替代在线计算。在这个数据规模日益激增的时代,如果希望以稳定的性能面对各类规模的数据挑战,Apache Kylin或许才是你的首选!
讲师介绍:
Dong Li (Kyligence)
Kyligence技术合伙人兼高级软件架构师,Apache Kylin Committer & PMC Member,专注于大数据技术研发,KyBot技术负责人。毕业于上海交通大学计算机系;曾任eBay全球分析基础架构部高级工程师、微软云计算和企业产品部软件开发工程师;曾是微软商业产品Dynamics亚太团队核心成员,参与开发了新一代基于云端的ERP解决方案。
除了干货预告,Kyligence还为大家准备了一大波的折扣码!
就是下图这个码,有购票需求的童鞋们在今天动动手指把二维码扫起来,然后输入:KYLIGENCE,就能以惊喜折扣价购北京站门票啦~
(文章转载自OReillyData)
更多详情点击阅读原文获取。
"Apache and Apache Kylin are either registered trademarks or trademarks of The Apache Software Foundation in the US and/or other countries. No endorsement by The Apache Software Foundation is implied by the use of these marks."
您可能还会想看
【技术帖】Apache Kylin 2.0为大数据带来交互式的BI
【KyBot】KyBot 现已支持Apache Kylin知识库和工单系统
【技术帖】Apache Kylin高级设置: 必要维度 (Mandatory Dimension)原理解析