赵小洛洛洛

其他

AB实验系列一:基础概念

实验是我们的基本工具。我们需要多个流量组提出多个策略想法,然后通过比较不同组的指标表现来选择最合适的方案。做ab实验需要两个条件为前提:同质性和无偏性。
2022年9月5日
其他

用因果推断解决的四类分析难题

一、背景目前我们能看到因果推断相关的资料更多的聚焦在逻辑方法本身,公式非常繁杂导致较难理解与应用。有的时候虽然看似理解了一些,但是真正应用的时候还是不太清楚什么场景应该选择什么方法。基于此种背景,笔者梳理一些目前业界的通用业务问题场景,按照不同分析场景类型分为四大类,分别对应不同的适用因果推断解决方法,并辅以通俗易懂的语言去解释其原理与案例。当遇到某类问题的时候,我们能快速明确的知道用什么方法可解此类问题。二、四类分析场景与对应解决方法概览三、分析场景与适用方法场景一:非实验场景策略效果评估策略、功能以及活动的效果评估,几乎是每个产品、运营、分析师日常工作的一大重点。大到重要功能上线,小到一个文案修改,都可以去衡量这个策略的效果,比之前提升了多少,对整体数据贡献了多少。不仅衡量了工作产出,也为之后的优化方向提供沉淀与依据。AB实验是回答这个问题的最优解,但是当无法做实验时,研究如何利用历史数据进行因果分析评估也变的非常重要。非实验场景的策略评估方式的核心思想就是:人为创造一个虚拟对照组与策略上线数据做比较估计策略真实效果。效果回归本质上属于统计学中的因果推断问题。在统计科学中,因果推断要解决的问题本质是剥离我们所不关心的外部变量对结果的影响,从而精准估计到我们所关心的策略因素对结果的单一影响。在不能做AB实验的场景下,通常有两种完成这件事情的思路:构造相似群体(Matching):这种思路假设在未被实验策略影响的样本中存在一些样本和被实验策略影响的样本存在同质性。只要我们想办法找到这些相似的样本作为虚拟对照组,就可以控制外生因素。这种思想最经典的方法是PSM(倾向得分匹配法);构造虚拟现实(Synthetic
2022年6月6日
其他

如何优雅的拟合非线性曲线

这次真的和阿猪老师学到了,深度学习降维打击数据拟合竟然是这么的高效!某天下班,小洛在微信上忽然呼叫我:我一看好家伙,这不是手到擒来?这也太简单了,直接开整:一、curve_fit函数拟合众所周知,scipy就可以进行曲线拟合,直接开整:输出效果:某位同学一头雾水:我要的是非线性的函数,为啥出来的是一条直线?还相差这么远?二、这个表达式是合理的吗?优化的第一步:可以看到函数内的-b*(x-a)
2022年6月3日
其他

该把优惠券发送给哪些用户?一文读懂Uplift模型

随着互联网和人工智能的普及化,个性化营销已经渗透到了我们生活中的方方面面。而如何找到真正的营销敏感人群,将更多的预算投入到可以带来‘增量’的用户上,以提升整体营销roi,成为了后时代精细化运营的关键。uplift模型可以很好的解决这一问题,本文将介绍此模型以及其如何应用于智能营销的底层原理。01什么是Uplift模型?用一个简单的例子来介绍此模型。假设我们是个电商平台,一件标价300元的商品,用户的购买率为6%。现有一批预算可以给用户发放10元的优惠券以提升用户购买率。需要给每个用户都发放优惠券吗?答案显然是否定,那么这批优惠券应该发送给平台的哪些用户呢?此时我们脑海中有四类用户:Persuadables:不发送优惠券则不买,发送优惠券则购买;Sure
2021年8月28日
其他

拒绝后知后觉,分析师主动破局之路

本文以“618电商促销”为案例,讲讲分析师从活动预备阶段开始,如何逐步展开工作,找到自己的位置。数据分析师被提需求时,往往是业务方需要汇报成果,需要数据做辅助支持。点头之交的业务方可能认为分析师就是个提供所需数据的岗位,对数据的驱动作用不甚了解。因此,要么一百年不翻牌,认为不需要分析师即可完成业务闭环;要么是需要汇报时没完没了的取数;或者是要求分析师回答“清楚豆瓣与豆瓣酱区别”这样的需求。长此以往,分析师尴尬被动,像个青涩的姑娘,怕你不来,但又怕你乱来。
2021年5月9日
其他

从工业化到智能化,未来的AB实验是什么样子

,文章内容暂且不论,主要想聊下这个标题。实验方面的权威著作《Trustworthy
2021年5月8日
其他

我从研究院转型为头部互联网分析师

小洛:今年1月底Jasmine找到我的时候,她在研究院工作,虽然已经自学了一段时间的数据分析,但对于转行却心有忐忑。基于之前在「因果推断学习小组」建立的信任,我决定尽力帮助她。从简历到面试到offer谈判,历经2个多月的辛苦,我们的努力最终换来了满意的结果,Jasmine拿到了多家头部互联网offer。希望她的转行经验与准备过程,可以给到大家一个借鉴与帮助。大家好,我是Jasmine,最近零经验求职互联网数据分析相关岗位,在小洛的帮助下拿到了头部大厂offer,这篇文章就来细细分享一下我的转行历程,希望能给在路上的小伙伴一点参考。一
2021年4月12日
其他

我如何0经验拿到一线大厂数分实习offer

大家好,我是Downey,是一名澳洲在读研究生,这一篇关于我是如何找到数据分析实习的经历,希望我的一些小小经验可以对目前正在寻找数分&商分实习的同学有帮助。简单介绍一下自己的情况,由于疫情的原因,始终在国内上网课,考虑到今年9月就要参加秋招,而自己目前并没有任何互联网相关的实习,决定北上,经过一段时间的努力,最终有幸拿到了京东数据分析岗位的实习offer。简单说一下我的时间进程。2.24
2021年3月6日
其他

数据分析面试准备之方向选择

在上一篇文章中,我们讲了如何写好一份数据分析师的求职简历,相信大家获益良多。准备好简历后,接下来就需要针对性的进行公司岗位的选择投递及对应岗位的面试准备。在这个过程中也有非常多的策略,今天我来为大家分享一下这部分的注意要点。关于详细的数据分析面试准备详见数据分析师面试准备一文,本文主要探讨方向上的选择、投递策略以及业务知识准备;一
2021年3月4日
其他

我做分析师的十年感受 ( 二 )

种一棵树最好的时间是十年前,其次是现在。十年了,本次分享大多来自工作中的日常所思所想,欢迎自取。前情指引:我做分析师的十年感受在招聘网站上输入「数据分析」,头部一些薪资较高的大公司岗位的任职要求里,会出现
2021年2月26日
其他

我做分析师的十年感受

很多时候,我们会认为自己做的事情很普通,有不少知识掌握了就自认为我会了,缺少深度思考,回过头来看,不妨多反问下自己,你是真的会了么?对这个事情的本质、本源都抓到精髓了么?
2021年2月24日
其他

【长文干货】为什么数据分析师需要懂算法

通过和一些朋友交流,发现目前一些数据分析师,其实不是很清楚机器学习可以如何应用于业务,也不清楚自己到底要不要去学习算法知识。实际业务中一些复杂算法场景例如商品推荐、内容推荐、匹配策略等,其实都需要数据分析师做大量的探索验证工作。分析师前期可以为建模指导方向,中后期也为模型的优化提供一些新的思路与数据洞察,此外用算法还可以大大提升分析效率与分析科学性。今天,就让我们详细的来了解一下数据分析师与算法的前世今生。
2021年2月20日
其他

一线数据分析师教你如何写简历才能脱颖而出!

选择和意向公司业务最匹配,方法论可复用的项目4、行动的体现不论在项目描述还是在工作经历描述中,注意行动的体现,用了什么分析方法?如何推动了分析结论的落地?多一些动作描述,突出自己的主观能动性。
2021年2月4日
自由知乎 自由微博
其他

数据分析岗位面试准备请看这篇!

面试过一些人,也被人面试过,今天我来谈谈对数据分析岗位面试准备的理解,特别是互联网行业面试考察的主要方面,以及如何快速准备。注意,面试准备大体上仅针对面试,并不会涵盖数据分析全方面的知识体系,特此建议初学者经过系统化学习后,再进行相关面试准备。在大家开始找工作之前,至少留出2周时间进行知识梳理及过往经验总结,系统化处理碎片信息。面试准备时间过长的话容易导致疲惫,过短则可能准备不充分,大家一定要按照自己的实际情况进行安排。注意,本篇仅适用于0-5年数据分析师哦。以下分几个方面来讲讲数据分析的面试准备。一、统计学
2020年6月21日
其他

AB test 你要知道的都在这里,数据分析师面试必知

test,具体做法是在全量中抽样出两份小流量,分别走新推荐策略分支和旧推荐策略分支,通过对比这两份流量下的指标(这里按用户点击衡量)的差异,可以评估出新策略的优劣,进而决定新策略是否全适合全流量。
2020年3月24日
其他

统计学知识系列:一篇搞懂假设检验

P值:是一个概率值,如果原假设为真,p值是抽样分布中大于或小于样本统计量的概率。左检验时,p值为曲线上方小于等于检验统计量部分的面积。右检验时,p值为曲线上方大于等于检验统计量部分的面积。
2020年3月22日
其他

聊聊数据指标体系搭建流程

随着业务的发展,不同时期产品的衡量指标会变化,我们关注的重点指标可能改变,会有一些新指标的增加及旧指标的淘汰,我们需要将指标体系持续的更新优化以满足业务的需要。
2019年10月27日
其他

产品日活DAU下降,我该如何着手分析?

针对初步定位的影响范围,进行进一步的排查。分三个维度来做假设,建议针对数据异常问题专门建一个群,拉上相应的产品、技术、运营人员一起,了解数据异常时间点附近做了什么产品、运营、技术侧调整。
2019年6月15日