其他
Apache Paimon 实时湖仓存储底座
导读 非常荣幸能够与大家分享 Apache Paimon 项目的一些进展,包括业务进展和技术进展。本次分享包括四个部分。首先是关于实时湖仓的介绍,什么是实时湖仓、为什么需要实时湖仓?第二部分介绍与 Apache Paimon 相关的技术。第三部分介绍 Paimon 在各个公司的主流应用场景。最后一部分将介绍 Paimon 目前正在发展的一些前沿技术。
主要内容包括以下几个部分:1. 实时湖仓
2. Apache Paimon
3. 应用场景
4. Paimon 前沿技术
分享嘉宾|李劲松 阿里云 开源大数据表存储负责人
编辑整理|伍昊华
内容校对|李瑶
出品社区|DataFun
01
实时湖仓
第一个含义是 ETL 的时效性,也就是数据流入数仓中,什么时候能够全部处理完毕,准备好查询,这个 ETL 的时间在批处理计算中通常是按天或小时计算的,根据分区来定义。 另一方面是查询的时效性,会因使用的查询引擎而异。例如,使用 Spark 或 Hive 进行查询通常需要分钟级的时间,而使用 Doris 进行查询则可能达到秒级。
02
Apache Paimon
对象存储友好
ACID transactions
INSERT & UPDATE & DELETE
Time Travel and rollback
Schema Evolution
Tag & Branch
03
应用场景
04
Paimon 前沿技术
分享嘉宾
INTRODUCTION
李劲松
阿里云
开源大数据表存储负责人
李劲松,花名之信,PMC Chair of Apache Paimon,PMC Member of Apache Flink,阿里云开源大数据表存储负责人。
往期推荐
LLM+RAG:大模型在金融场景的落地探索
95% 向量资源节省,火山引擎云搜索 RAG 技术体系演进
天穹数仓自治能力在大模型时代的新实践
推荐系统融合排序的多目标寻优技术
GenAI时代的实时数据分析:Apache Pinot与向量索引技术探秘
金融,大模型落地的关键场景!
打造 LLMOps 时代 Prompt 数据驱动引擎
基于大模型的数据治理应用新范式
阿里云智能大数据演进
Agent+Copilot:大模型在智能运维领域的应用
点个在看你最好看
SPRING HAS ARRIVED