查看原文
其他

小米-数据仓库高级工程师面试题

群友投稿 数据仓库与Python大数据 2022-11-29


导读:本文将带你一起回顾小米大数据数仓面试题。十一节假日前面试应邀整理总结,借“数据仓库与Python大数据”公众号分享给大家,一起进步。


小米大数据数仓岗位面试题


1:先讲数仓项目流程,然后sql优化,数据倾斜,Hive调优,压缩格式,Hadoop原理, MR Shuffle过程,写过那些UDF


2:现场手写sql(行转列,留存率,7天连续3天登录,还有就是现场临时给的sql题)


3:数仓怎么分层的,主题怎么划分,项目中各层模型如何设计的,然后模型做了那些优化,拉链表怎么做


4:sqoop和datax的区别,数据导入导出遇到那些问题case


5:Spark sql和Hive sql的执行过程原理,Spark的提交过程参数设置, Saprk RDD算子有哪些,Spark做离线做了那些方面的优化,Spark shuffle过程


6:Spark和Flink对比,Flink运行原理,架构,消息怎么精准一次性,消息挤压 ,Flink CDC等等 

ps:关于Flink的问题我直接说项目中没用过,自己学过,一般面试官就简单问一下就过了


7 Hbase 原理 和Kakfa原理, Kafka结合Flink一起问 


8 OLAP引擎Clickhouse,Doris,Impala,ES等相关原理和使用优化


9 Mysql的索引场景题,连着问了好几个什么场景用什么索引(当时问的我焦头烂额)


10 Shell 中的一些基本命令,$1和$0的区别,怎么查找后台运行的命令 ,写过那些脚本case



作者寄语



今天的分享就到这里,希望能抛砖引玉,对你有所帮忙。关注公众号第一批粉丝,学到了很多干货和技能,也希望今天的分享能让大家有所收获。最后,再次谢邀,感谢紫霞约稿,也欢迎大家关注这个大数据领域高质量公众号,一起进步!

作者:群友(应群友要求匿名)
征稿:欢迎广大读者粉丝朋友投稿,及相关事宜请加v:iom1128,谢谢!



☞ 美团-数据仓库高级工程师一面

☞ 美团-数据仓库高级工程师二面

☞ 教育-数仓高级开发工程师面试题

☞ 巨头-数仓高级研发工程师面试题

☞ 橙心优选-数据仓库高级工程师面试

☞ 字节跳动-数据仓库高级工程师面试


▼ 阿里 | 记一次蚂蚁金服面试经历

▼ 头条 | 大厂大数据开发面试经验

▼ 快手 | 记一次数据岗位大厂面试

▼ 校招 | 一个BAT校招面试官 1 天

▼ 美团 | 数据仓库高级工程师面试

▼ 字节 | 数据仓库高级工程师面试

▼ 拼多多 | 记一次拼多多面试经验

▼ 2020大数据Java面试总结(未完待续)

▼ 2021大数据架构干货文章精选(推荐收藏)




更多干货,请戳"阅读原文"到"面试系列"查看



关注不迷路~ 各种干货、资源定期分享

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存