蚂蚁金服-数据仓库高级工程师面试
点击上方蓝色字体,置顶/星标哦
目前10000+人已关注加入我们
导读:本文将带你一起回顾蚂蚁金服大数据数仓面试。tips:公众号后台回复“620”可参与包邮送书和红包抽奖。
蚂蚁金服大数据数仓岗位的面试经历
一、前言
本人一直在外企做传统数仓也差不多十年了,技术栈都是以关系型数据库和商业工具为主。看着日新月异的大数据技术的发展和数仓架构的不断迭代,想跳到互联网企业看看去接触新的业务和技术栈。
今年七八月份开始看机会跟猎头也大致说了下我的需求和情况。八月底猎头跟我说蚂蚁金服那边有个数仓岗位我看了下JD,主要还是侧重整体数据架构和数据仓库的理解,我觉得匹配度不错就决定尝试下这个机会。
面试过去也有一段时间了,可能漏了一些问题,只是整理了些印象还算清楚的问题,希望能对你有所帮助。
二、电话面
一面&二面,一面面试官是你所在组的组长。二面面试官是应该是组长的领导都是考察技术为主:
这两轮面试的面试问题和考察点重复度比较高,可能一面更偏向技术细节点,二面的面试官更偏向架构和理解一点,我就放一起说了以下问题不是面试实际顺序。
一.首先几分钟的自我介绍
大致介绍下自己的教育背景和工作经历以及主要的项目经历等等
二.对于数据仓库的理解,数据仓库主要为的解决什么问题
三.数据仓库模型的理解,数据仓库分层设计的好处是什么
四.数据建模考虑的点是什么,然后随机给了你一个业务场景问问你如果建立模型大致怎么设计
五.你挑一个你印象最深刻的项目来描述下以及为什么让你印象最深刻
这个问题要慎重回答,对于经验比较丰富的建议要么回答你对架构做了些有亮点设计的项目要么就是从业务上带来很大价值的项目
六.你处理过最大的数据量大概是多少,遇到性能问题时候怎么优化
七.对于数据中台的理解,和数据仓库和数据湖的区别
八.MAPREDUCE的主要过程,MAP阶段和REDUCE阶段的SHUFFLE各是什么过程
九.SORT BY和ORDER BY的区别
十.分桶和PARTITION的区别,并且分桶和PARTITION的各自机制是什么
十一. HIVE数据倾斜的原理和不同场景下的解决方案是什么,MPP架构数据下的数据倾斜解决方案是什么
题目答案可加群与作者直接交流哦
现在回想起来的问题大致就以上这些还有些在讲项目过程中的具体问题就不列出来了这个完全因人而异。
一面和二面间隔时间大概一周左右,有的时候是突然打电话过来的。建议知道有面试前就做好准备,要不然被突然袭击有可能发挥不好。面试官很专业而且态度非常友好,应该是我经历过的面试中面试体验最棒的。
三、现场面
后来被告知两轮电话面通过,需要到杭州现场面。阿里对面试候选人还是比较厚道的,基本等同于出差一样,酒店来回交通费用吃饭都是报销的。
现场面第一轮,面试官是业务和交叉业务的LEADER(P9级别)以及HRBP,去之前我还是做了技术面的准备,但是那天基本没有考察技术细节。
面试题目 | 现场面:
自我介绍几分钟 谈谈你对元数据管理和数据资产管理的理解 你认为你来做这个岗位的优势和劣势是什么 谈谈你对这个岗位所需技能的理解,假如你来到这个岗位未来半年你的工作思路是什么 以你对传统数仓的理解,什么样的业务会有实时性的需求? 挑一个你印象最深刻的项目,这个项目你觉得哪些地方可以再优化的?还有些项目延伸的问题。 针对蚂蚁金服的具体业务部门,让你谈一谈你对这块业务的理解和数据如何给业务产生价值
现场面大致印象比较清楚的就以上这些问题,当然面试过程中面试官可能会随时打断你在你陈述的基础上再追问,也有个别面试官可能故意是很挑战的语气,遇到这种情况不要慌还是把自己的思路表达清楚即可。
第一轮面试大致持续了一个小时,然后参与面试的内部讨论下。如果一致通过就会接下来和大部门的领导(P10级别)加上另一个HRBP再谈谈人生谈谈理想,基本就是看看价值观有没有问题就不赘述了。
四、结束语
总体面试流程下来,感觉我遇到的这个部门LEADER可能对具体的工具不是特别在意,更在意的是你对你所做工作理解的深度,以及你这个人的个性是什么样的。当然也有很多面试官更侧重于你实际的技术栈匹配度这个就因人而异了。
觉得内容还不错的话,请分享给更多的朋友哦
01. 想要和作者群内沟通,请添加小助手微信[ ID:iom1128 昵称:仙子紫霞],备注:加群,加入高手如云。技术大佬们在等你,各种资源定期分享~
02. 公众号后台回复「06」领取「数据仓库」「数据治理」等经典电子书籍或视频赠送。
R爱你哟 ~
☆Data Vault 2.0架构
☆大数据时代:数据治理☆实时数仓在有赞的实践
欢迎大家关注呀!
!关注不迷路~ 各种福利、资源定期分享!