高级数据研发工程师面试—已拒offer
Editor's Note
The following article is from 大数据技术团队 Author 曹丕㐇
大家好,我是空空。空杯的空!
老朋友了。
写在前面:
2021.05月份期间面试整理,防止核心技能弱化,悄悄面了个试。互联网巨头,已拒offer,薪资未达到预期。面试题借社区平台分享给大家!
一面,大约60分钟
1. 自我介绍
2. 星型模式、雪花模型、星座模型异同
3. 数仓分层架构设计、模型与为什么
4. 你们数仓中拉链表怎么设计,分区、增量拉链、全量拉链
5. 事实表三种类型
6. 数仓团队工作分工、与流程
7. 你们元数据管理怎么做的
8. 你们集群是什么规模?每台服务器什么配置?
9. 数仓中用的存储格式,ORC和Parquet异同
10. Hive中的UDF、UDAF和UDTF
11. 开窗函数考察、排序等函数
12. Sort by和Order by的区别
13. 行转列和列转行
14. Hive中Join原理
15. 给一个具体的场景,做建模设计
16. 最复杂的业务场景
17. 指标体系如何搭建
18. Hive的优化及SQL优化
19. SQL题:求波峰波谷
20. SQL题:求n日留存
21. Shell脚本什么水平,简单文了一下
22. 链表,bitmap
23. 你有什么问我的吗?
二面,大约40分钟
1. 自我介绍
2. 数据采集到应用全流程,数据同步工具
3. 为什么用kafka
4. 离线与实时碰到的技术问题,及如何解决的
5. spark任务提交流程
6. sparkSQL执行过程,sparkcore,spark优化
7. Flink了解多少,窗口、水位线
8. 数仓建模如何全局优化
9. 如何评价数仓的好坏,与你的业绩产出
10. 数据倾斜case讲解,层层深入
11. 现场SQL题3道,比较简单
12. OLAP技术如何选型及原因
13. 数据平台工具链
14. 最擅长的技术栈
15. 聊了一下兴趣爱好、家庭、职业发展等
16. 你还有想问我的吗?
Respect ~
☑Apache Flink 学习0-1知识点全景图.xmind
欢迎大家关注呀!
分别回复关键词:666 777 源码 中台 画像 资料 spark ck 就业指导等都可以领取各种资源!