全网第一份 | Flink学习面试灵魂40问,看看你能答上来几个?
The following article is from 暴走大数据 Author 群主王知无
By 暴走大数据
转载请联系作者本人。
答案将在下期给出。概念和基础篇
简单介绍一下Flink
Flink相比传统的Spark Streaming有什么区别?和Spark中的structured streaming 相比呢?Flink相比ss和storm有什么优势?
Flink的组件栈是怎么样的?
Flink的基础编程模型了解吗?
说说Flink架构中的角色和作用?
说说Flink中常用的算子?用过哪些?
Flink中的分区策略有哪几种?
Flink的并行度有了解吗?Flink中设置并行度需要注意什么?
Flink支持哪几种重启策略?分别如何配置?
Flink的分布式缓存有什么作用?如何使用?
Flink中的广播变量,使用广播变量需要注意什么事项?
Flink中对窗口的支持包括哪几种?说说他们的使用场景
Flink 中的 State Backends是什么?有什么作用?分成哪几类?说说他们各自的优缺点?
Flink中的时间种类有哪些?各自介绍一下?
WaterMark是什么?是用来解决什么问题?如何生成水印?水印的原理是什么?
Flink的table和SQL熟悉吗?Table API和SQL中TableEnvironment这个类有什么作用?
Flink如何实现SQL解析的呢?
进阶篇
Flink是如何做到批处理与流处理统一的?
Flink中的数据传输模式是怎么样的?
Flink的容错机制知道吗?
Flink中的分布式快照机制是怎么样的?
Flink是如何实现Exactly-once的?
Flink的Kafka-connector是如何做到向下兼容的呢?
Flink中的内存管理是如何做的?
Flink中的序列化是如何做的?
Flink中的RPC框架选型是怎么样的?
Flink在使用Window时出现数据倾斜,你有什么解决办法?
Flink SQL在使用Groupby时出现热点数据,如何处理?
现在我有Flink任务,delay极高,请问你有什么调优策略?
Flink是如何处理反压的?和Spark有什么区别?Storm呢?
Operator Chains(算子链)这个概念你了解吗?Flink是如何优化的?什么情况下Operator才会chain在一起?
源码篇
讲讲一个Flink job提交的整个流程吗?
讲讲一个Flink job调度和执行的流程吗?
Flink所谓"三层图"结构是哪几个"图"?它们之间是什么关系?他们之间是如何转化的?
JobManger和TaskManager分别在集群中扮演了什么角色,说说它们都做了些什么?
简单说说Flink数据的抽象和数据的交换过程
Flink的分布式快照机制是如何实现的?
Flink的反压是如何实现的?
说说FlinkSQL是如何转化的?了解逻辑计划和和物理计划吗?FlinkSQL的维表JOIN是如何做的?了解Async IO吗?解决了什么问题?
欢迎点赞+收藏
欢迎转发至朋友圈