难倒81%数据分析师的面试题!
从网上整理了11道数据分析面试真题,供大家参考学习~
注:其中第一题之前文章有涉及到过,现已做了修正
统计学部分
1、一副扑克牌一共54张,平均分成2份,求这2份都有2张A的概率
2、男生录取率增加,女生录取率增加,总体为何减少?
3、置信度与置信区间是什么意思?
答案
假设检验的基本原理只有3个:
一个命题只能证伪,不能证明为真
在一次观测中,小概率事件不可能发生
在一次观测中,如果小概率事件发生了,那就是假设命题为假
证明逻辑就是:
我要证明命题为真——证明该命题的否命题为假——在否命题的假设下,观察到小概率事件发生了——否命题被推翻——原命题为真
比如:要证明A是合格的投手——证明“A不是合格投手”这个命题为假——观察到一个事件(比如A连续10次投中10环),而这个事件在“A不是合格投手”的假设下,概率为p,小于0.05——小概率事件发生,否命题被推翻。
可以看到p越小——这个事件越是小概率事件——否命题越可能被推翻——原命题越可信
5、怎么向小孩子解释正态分布
答案
业务思维部分
1、卖玉米如何提高收益?价格提高多少才能获取最大收益?
品牌打造获得长期溢价,但缺陷是需要大量前期营销投入;
加工商品占据价值链更多环节,如熟玉米、玉米汁、玉米蛋白粉;重定位商品,如礼品化等;
价格歧视,根据价格敏感度对不同用户采用不同定价。
who:用户(新用户/老用户、渠道、画像等) when:访问时段 where:产品(产品类型)
销售额=浏览量*转化率*客单价 销售额=GMV-取消订单金额-退货订单金额 假设检验:确定问题源头,分析原因,提出假设再验证,再假设再验证
内部原因:产品、价格、渠道、促销(4P营销理论) 外部原因:政治、经济、社会、技术(PEST分析)
3、若用户留存率下降如何分析?
内部:用户获取及激活(AARRR模型)、产品 外部:PEST,主要考虑竞品影响
进一步细分,如玩家数量 = 老玩家数量 * 活跃度 + 新玩家数量 * 留存率等。然后对各个指标与以往的数据进行对比,发现哪些环节导致收入下降
a. 内部:产品变化、促活活动、拉新活动、定价策略、运营策略、服务器故障等
b. 外部:用户偏好变化、市场环境变化、舆论环境变化、竞争对手行为、外部渠道变化等
数据挖掘部分
1、数据库与数据仓库的区别
简单理解下数据仓库是多个数据库以一种方式组织起来,数据库强调范式,尽可能减少冗余;而数据仓库强调查询分析的速度,优化读取操作,主要目的是快速做大量数据的查询。
数据仓库定期写入新数据,但不覆盖原有数据,而是给数据加上时间戳标签;数据库采用行存储,数据仓库一般采用列存储。
数据仓库的特征是面向主题、集成、相对稳定、反映历史变化,存储数历史数据;数据库是面向事务的,存储在线交易数据。
2、什么是聚类分析?
a. 层次聚类
b. 划分聚类:kmeans
c. 密度聚类
d. 网格聚类
e. 模型聚类:高斯混合模型
来源:数据分析不是个事
转自:成都数据分析
后台回复“入群”
即可加入小z干货交流群
Get👇