其他
理想汽车基于Flink on K8s的数据集成实践
导读 本文将介绍理想汽车在 Flink on K8s 的数据集成落地实践。
分享分为四个部分:1. 理想数据集成的发展与现状
2. 数据集成的落地实践
3. 数据集成云原生的落地实践
4. 未来规划
分享嘉宾|王小静 理想汽车 高级大数据工程师
编辑整理|戴志敏
内容校对|李瑶
出品社区|DataFun
数据集成的发展与现状
产品能力缺失。需要在多套平台之间切换,没有直接可落地的产品,需要开发团队写代码。 多套开发语言。无论是 Flink、Spark 还是 DataX 等等,每一个引擎都有其特有的配置,需要同时了解多套开发语音和不同的开发细节。 资源共享难。由于批流使用不同的引擎,由不同的团队开发,底层的计算和存储资源很难共享。 资源利用率低。正是由于资源共享难,又引发了另外一个问题,就是资源利用率低,且存在不均衡的状况。比如实时计算集群,是长期运行的任务,其计算资源经常吃紧,但是存储资源基本上处于没有使用的状态。
数据集成的落地实践
1. 数据集成平台架构
2. 设计模型
3. 典型场景
4. 异构数据源
5. SQL 形式的过滤条件
数据集成云原生的落地实践
1. 方案选型
2. 状态判断及日志采集
3. 监控告警
4. 共享存储
未来规划
分享嘉宾
INTRODUCTION
王小静
理想汽车
高级大数据工程师
从事大数据领域开发 10 年,对大数据组件有深入的了解及落地经验,spark、flink-cdc 的 contributer。
往期优质文章推荐
往期推荐
DataFun
点个在看你最好看