查看原文
其他

教育-数仓高开工程师面试题

刘清风 数据仓库与Python大数据 2022-11-29


1.如何搭建数仓,全流程说一下

2.数仓分层、主题域、建模流程

3.数仓团队如何分工的,职责可否再优化

4.你最擅长的业务模板讲一下

5.你经历过最复杂的业务场景讲一下

6.埋点、流量域如何建设的

7.元数据和数据血缘的关系,你们是如何做元数据管理的,详细说下

8.熟悉的调度系统选型对比,依赖触发和时间触发的优缺点

9.熟悉的BI报表工具选型对比

10.olap用的哪个组件,适用场景

11.数据质量全面展开说下,如何做的,dqc如何保证,sla如何保障与优化手段

12.目前数仓存在的问题与痛点,可以从业务、模型、技术多个方向展开说下

13.用户画像如何做的

14.sqoop同步数据遇到数据倾斜怎么处理,或有没有替代方案

15.hive数据倾斜的原因、场景与解决方案

16.hive优化方式有哪些

17.如何确定map数、reduce数

18.cube、grouping sets、grouping__id

19.数据量级、表/任务量级、集群量级

20.实时数仓做过吗,可简单说一下

21.给一个业务场景,让现场模型设计,基于模型又写了3个SQL(主要考察分析函数)

22.为什么离职,期望一个什么样的团队

23.工作中你最出色的产出是什么

24.以后如何职业规划与未来发展



作者寄语



今天的分享就到这里,希望能对你有所帮忙。关注公众号差不多有两年了,学到了很多干货和技能,也希望今天的分享能让大家有所收获吧。最后,再次谢邀,感谢紫霞约稿,也欢迎大家关注这个公众号,一起进步!

作者:刘清风
征稿:欢迎广大读者粉丝朋友投稿,投稿及相关事宜请加v:iom1128,谢谢!


▼ 阿里 | 记一次蚂蚁金服面试经历
▼ 头条 | 大厂大数据开发面试经验
▼ 快手 | 记一次数据岗位大厂面试
▼ 校招 | 一个BAT校招面试官 1 天
▼ 美团 | 数据仓库高级工程师面试
▼ 字节 | 数据仓库高级工程师面试
▼ 拼多多 | 记一次拼多多面试经验
▼ 2020大数据Java面试总结(未完待续)
▼ 2021大数据架构干货文章精选(推荐收藏)



回复:999,下载资料

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存