查看原文
其他

高级数据研发工程师面试—已拒offer

Editor's Note

空总腻害~!已拒offer,35k?45k?咱也不敢说,咱也不敢问=.=

The following article is from 大数据技术团队 Author 曹丕㐇

大家好,我是空空。空杯的空!

老朋友了。


写在前面:

2021.05月份期间面试整理,防止核心技能弱化,悄悄面了个试。互联网巨头,已拒offer,薪资未达到预期。面试题借社区平台分享给大家!



一面,大约60分钟


1. 自我介绍

2. 星型模式、雪花模型、星座模型异同

3. 数仓分层架构设计、模型与为什么

4. 你们数仓中拉链表怎么设计,分区、增量拉链、全量拉链

5. 事实表三种类型

6. 数仓团队工作分工、与流程

7. 你们元数据管理怎么做的

8. 你们集群是什么规模?每台服务器什么配置?

9. 数仓中用的存储格式,ORC和Parquet异同

10. Hive中的UDF、UDAF和UDTF

11. 开窗函数考察、排序等函数

12. Sort by和Order by的区别

13. 行转列和列转行

14. Hive中Join原理

15. 给一个具体的场景,做建模设计

16. 最复杂的业务场景

17. 指标体系如何搭建

18. Hive的优化及SQL优化

19. SQL题:求波峰波谷

20. SQL题:求n日留存

21. Shell脚本什么水平,简单文了一下

22. 链表,bitmap

23. 你有什么问我的吗?




二面,大约40分钟


1. 自我介绍

2. 数据采集到应用全流程,数据同步工具

3. 为什么用kafka

4. 离线与实时碰到的技术问题,及如何解决的

5. spark任务提交流程

6. sparkSQL执行过程,sparkcore,spark优化

7. Flink了解多少,窗口、水位线

8. 数仓建模如何全局优化

9. 如何评价数仓的好坏,与你的业绩产出

10. 数据倾斜case讲解,层层深入

11. 现场SQL题3道,比较简单

12. OLAP技术如何选型及原因

13. 数据平台工具链

14. 最擅长的技术栈

15. 聊了一下兴趣爱好、家庭、职业发展等

16. 你还有想问我的吗?



Respect ~


☑大数据生态0-1全景图谱.xmind

☑实时数仓ClickHouse全面学习指南.xmind

☑Apache Flink 学习0-1知识点全景图.xmind



 LakeHouse | 网易湖仓一体的探索与实践

 Clickhouse 在唯品会数仓SLA的探索实践

 从0到1,四步搭建高价值指标体系





欢迎大家关注呀!

分别回复关键词:666 777 源码 中台 画像 资料 spark ck 就业指导等都可以领取各种资源!


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存