这有一份今日头条数据分析面经
The following article is from DataGo数据狗 Author 夏芷
1)F检验是检验两个正态分布的样本的方差是否存在显著差异
2)也可以用于对多组样本之间比较
3)计量中,F检验原假设所有自变量对因变量都没有影响,排除原假设说明至少有一个自变量对因变量有影响
P值,碰巧的概率,对无效假设的统计意义
P>0.05 碰巧出现的可能性大于5% 不能否定无效假设 两组差别无显著意义
P<0.05 碰巧出现的可能性小于5% 可以否定无效假设 两组差别有显著意义
P<0.01 碰巧出现的可能性小于1% 可以否定无效假设 两者差别有非常显著意义
SELECT date,cnameFROM Cost a INNER JOIN (SELECT date,max(cost) as maxcost FROM Cost GROUP BY date) bON a.cost=b.maxcost and a.date=b.dateALTER TABLE LogADD COLUMN is_new Boolean
UPDATE LogSET is_new = 1 WHERE date,cid in (SELECT min(date),cid from Log GROUP BY cid)次日留存率:(当天新增的用户中,在注册的第2天还登录的用户数)/第一天新增总用户数;
1)感知有用性:
a. 文案告知用户选择属性能给用户带来的好处
2)感知易用性:
a. 关联用户第三方账号(如微博),可以冷启动阶段匹配用户更有可能选择的属性,推荐用户选择
b. 交互性做好
3)使用者态度:用户对填写信息的态度
a. 这里需要允许用户跳过,后续再提醒用户填写
b. 告知用户填写的信息会受到很好的保护
4)行为意图:用户使用APP的目的性,难以控制
5)外部变量:如操作时间、操作环境等,这里难以控制
因为男女的点击率可能有较大差异,同时此时低点击率群体的占比增大。
如原来男性20人,点击1人;女性100人,点击99人,总点击率100/120。
现在男性100人,点击6人;女性20人,点击20人,总点击率26/120。
即那个段子“A系中智商最低的人去读B,同时提高了A系和B系的平均智商。
长视频平台,其实做的是“内容”的生意。长视频内容讲究质量,讲究独特,长视频平台则是一个综合实力的比拼,讲究片库的丰富度,内容的新颖度,爆款内容的持续性。同时,随着长视频平台的竞争日益引到自制内容层面,这又涉及到IP积累、内容创意机制、人才储备、行业关系等多方面的实力。
短视频平台,做的则是“流量”的生意。依靠流量来变现的产品,前期通过买量来收获第一批用户完成冷启动,之后再通过不断的资源、流量扶持来吸引更多创作者,让创作者生产内容,内容再吸引更多用户,由此便构成了由内容创作者(MCN、UGC、PGC)、平台、用户三方组成的完整生态。而在积累了流量之后,平台就可以快速通过广告来变现,之后还可以通过为创作者提供工具、渠道、生意来从中抽成。
猜你喜欢:
我的pandas数据清洗小工具箱(文末送书)
都2020年了,还在迷信啤酒与尿布!数据分析的真相是……
18个常见的数据分析面试题-概率统计类