查看原文
其他

直播回顾|Apache Doris源码阅读与解析系列第三讲 ——《数据的导入流程》

百度Doris团队 ApacheDoris 2022-04-24







课 程 介 绍


亲爱的各位小伙伴们,大家期待已久的直播课程终于跟大家见面了!


《 Apache Doris 源码阅读与解析》系列直播活动旨在帮助 Apache Doris 社区的开发者或者有意向参与 Apache Doris 社区建设的小伙伴们,可以更快熟悉 Apache Doris 代码的组织结构和一些主要流程的实现原理以及代码位置,以便于各位小伙伴们能够快速上手,参与到开发工作中来。


本系列直播课程暂定分为 10 次课程,涵盖了 Apache Doris 中大部分重点流程的讲解,包括建表语句执行、数据写入、SQL执行、数据读取、查询优化器以及元数据管理等。



课 程 回 顾


本期课程《 数据的写入过程》为 Apache Doris 源码解析系列直播课程 的第三讲,主要介绍导入作业将数据分发到对应的 BE 节点后,数据是如何一步一步写入到磁盘的,帮助大家了解:

  • 数据分发的分区分桶规则

  • Delta Writer -> Memtable -> Rowset -> Segment -> Page 的写入流程


直播回看地址:

https://www.bilibili.com/video/BV1Mu411f7wY/

复制以上链接并在浏览器中打开即可~


下 期 预 告


下期课程为《第四讲 —— 一条 SQL 的执行过程》,我们将从一个 SQL 查询语句出发,帮助大家了解以下内容:

  • SQL 的词法、语法、语义解析过程

  • 单机执行计划和分布式执行计划的生成

  • 查询计划的下发、火山模型的执行和结果返回。
由于查询优化器是一个相对复杂的模块,我们将会在第八讲专门针对查询优化器为大家介绍。
下期课程预计将于 10 月 27 日晚 19 点开始,课程时长约 45 分钟,届时我们将提前通过 Apache Doris 微信公众号发出直播链接,欢迎大家持续关注。

如果各位小伙伴有其他想了解的模块,欢迎在微信公众号后台向我们留言,也可以点击文末阅读原文填写调查问卷,我们将会另行安排大家感兴趣的模块进行讲解。

【往期回顾】
直播回顾|Apache Doris源码阅读与解析系列第二讲 ——《Stream Load 导入作业的执行流程》直播回顾|Apache Doris源码阅读与解析系列第一讲 ——《建表语句的执行过程》源码解析|Apache Doris源码阅读与解析系列第0讲——从零认识Doris代码库



【精彩文章】
从 NoSQL 到 Lakehouse,Apache Doris 的 13 年技术演进之路
应用实践| 新东方在线教育实时数仓的落地实践
最佳实践|Apache Doris Join 实现与调优实践




欢迎扫码关注:

Apache Doris(incubating)官方公众号


相关链接:

Apache Doris官方网站:

http://doris.incubator.apache.org

Apache Doris Github:

https://github.com/apache/incubator-doris

Apache Doris 开发者邮件组:

dev@doris.apache.org 







您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存