数据分析

其他

如何进行指标质量治理——指标系统(提质篇)

这个事实,区别在于,一个限定词是白金会员,另外一个是黄金会员。但根据一致性原则,虽然这两个指标不同,但是“支付”这个事实是相同的,所以“支付用户数”这个指标的业务口径、计算逻辑应该是一致的。
2021年6月24日
其他

推荐 :一文从0到1掌握用户画像知识体系

00引言前段时间上了一个用户画像的课程,授课老师是《用户画像:方法论与工程化解决方案》的作者赵宏田老师;另外也研读了一些讲述用户画像的文章。基于对上述学习内容的理解,同时结合工作实践,通过本文和大家分享下有关用户画像的认知、建设方法、产品化和应用。01初识用户画像1.1
2021年5月12日
其他

推荐 :如何通过数据分析选品(以新零售为例)

01选品的场景又见面了,我是热情依旧但一不小心就拖稿的Snowki。这次想和大家聊聊选品,选品其实是一个“宝藏”话题,你深入探索后会发现需要学习的东西越来越多,应接不暇。我仅能在有限的认知下,说说自己的理解,供大家开拓思路,或者娱乐也行。选品包含了很多大的场景,常见的有以下:电商平台选品推荐。根据商品画像和用户画像做千人千面推荐电商小B型商家选品。这在网上能找到很多相关信息,教大家如何根据市场热度、用户需求和心智,再结合一些分析套路选对热品,“发家致富”。例如亚马逊上火了的中国痰盂-老外尊享水壶(虽然好笑但很成功的例子)新零售选品。新零售概念很抽象,炒的也热(题外话,对新零售概念感兴趣的同学可以读读刘润老师写的《新零售:低价高效的数据赋能之路》,算比较通俗易懂的),比较主流的模式为线上线下一体化,选出的商品大多同时满足线上和线下场景的售卖,同质同价,比如盒马、便利蜂,售卖生鲜日百等生活相关的商品,并有线下本地商超。不同场景的选品策略、限制条件、影响因素等都大相径庭,需要细化场景,分开详述。本篇选品策略适用于有本地商超的大B商家,并在线上售卖日常消费品的新零售场景。02案例和基础概念新晋产品汪Snowki进入商品管理部门后,老板给了她首个任务:现有一个大卖场和一个便利店,线上线下销售表现均不理想,看看能否通过选品策略结合算法,调整品类结构,选出优质单品,牛转乾坤。品类?单品?大卖场和便利店又有什么区别?又如何量化复杂的业务场景?别急,我们结合案例往下看。单品也可以理解为SKU,即可售卖/库存的最小标准单位,选品也以此为单位。它和商品不太一样,举个例子,农夫山泉纯净水是商品,它下面有不同规格属性,通过属性确认唯一单品,一瓶农夫山泉纯净水1.5L即是一个单品。品类零售管理的核心,它不是按照商品原材料归类,而是将满足用户相似需求的商品逐级分类,这样能更有效、灵活地做出调整,顺应市场需求。例如,婴儿用品传统上分散于食品、服装、纸品等品类,但随着这部分商品销售贡献越来越庞大,逐步形成了新品类-孕婴童。大卖场可以理解为大型综合超市,占地面积很大,有2、3层购物空间的线下实体店,靠近生活区,有可能坐落郊区,常见的有沃尔玛、家乐福,经营商品基本满足用户全部所需,可售上万不同的单品。便利店面积小,经营小规格酒水饮料零食等便民商品,靠近学校、CBD、小区等人流量大的地方,开店密度高,常见的有711、全家、便利蜂。03解析案例,明确策略产品的核心价值案例中涉及到4个选品场景,大卖场线下、线上分别售卖什么?便利店的线上、线下分别售卖什么?需要根据不同场景选出建议售卖的商品清单。我作为一个不会复杂建模的“低配版”策略产品,与算法工程师的分工大致如下:而策略产品最核心作用便是对业务的深度理解,如何将抽象的业务场景量化为可供算法工程师参考的选品逻辑框架。04初识零售选品传统的零售选品,大多依靠人为经验判断,数据在其中至多起到辅助作用。例如日本的711便利店,定期会举办选品大会,品类部门选出主营商品供同台竞技,对于自有品牌的快餐鲜食,高级主管们会亲自参与品尝,如有异议,品类部门再拿出历史或市场数据作为佐证。这样选品存在的问题很明显:耗时耗人,每次选品大会前1个月品类部门便开始准备商品清单,往往选品大会一开就是一天,遇到换季或市场变动大时甚至需要一周按照人的经验判断存在主观性和信息滞后,可能会疏忽市场最新变化,错失商机算法选品,则是数据先行,人工审核为辅。将限制条件、内&外部影响因素、商品标签等相关参数投喂给模型,让模型给出推荐方案。目前做算法选品极具代表性的是便利蜂,通过算法模型推荐上架商品,店长只需要听从系统指示,执行物理操作既可。(题外话,便利蜂不仅用算法选品,还用算法为便利店选址、商品动态调价,面试还有可能考挺难的数学题哦~)算法选品的解决了传统选品存在的诟病,虽然初期模型计算结果不太稳定,但随着机器不断学习和数据训练,选品效果不会差于选品专家,长远来看它的优势不容小觑:节省人力成本,缩减选品耗时,品类部门可以从重复的选品低效劳动中释放出来不依赖于人的经验判断,减少出错率05构建选品策略便于理解,我画了一个简单的选品逻辑示意图,实际算法会比这个更复杂,需要结合很多业务细节。商品库B端商家有渠道、可采购的商品总池,不一定正常在售,甚至不一定经营过的新品,作为基础数据供算法处理、选择。限制条件在选品前,需要明确一些业务限制或要求作为前置条件,不满足这些条件的单品或品类不会进入后续的选品。常见限制条件有:单品数上限:影响算法选品的单品总数。线下选品数有门店物理空间、货架数限制,大卖场一般上万个单品,例如沃尔玛大卖场经营3~5W个单品;便利店由于面积狭小,一般上架2000-3000个单品;而线上选品虽然没有空间和货架限制,但是考虑用户在手机上选购时商品曝光率和配送成本问题,一般单品数控制在1500-5000品类覆盖率:大卖场线下基本要求品类全覆盖,应有尽有;便利店线下的品类基本覆盖在休闲食品、酒水饮料,而大型电器、衣服鞋帽等无需经营覆盖规格带覆盖:大卖场售卖规格繁多,基本没有限制;便利店受面积和用户需求影响,售卖规格小;线上选品大规格的单品更受青睐价格带覆盖:受商家定位影响,例如山姆超市定位高端,进口商品多,价格带偏高;物美超市主打中低端价格敏感用户,因而价格带偏低影响选品因素影响选品的因素有很多,且不同品类受到影响程度不同,例如冰淇淋受季节影响大,但卫生纸则不受季节影响。因此在用影响因素搭建选品模型时,需先将品类分为几类角色(或者可以理解为商品标签)再进行不同策略的选品:季节品:供需受季节强影响,最具代表性的:生鲜果蔬节日品:用户需求受节日强影响,具代表性:巧克力、红酒、计生用品(咳,情人节)核心热卖品:一年四季均可上架,为品类贡献80%的销售,具有市场竞争力,甚至代表商家形象,例如:盒马的海鲜新品:之前没有售卖,但是市场数据或需求趋势表明可以带来一定价值必备品:商品销售表现不一定优异,甚至垫底,但不能不选,因为缺少了会给客户带来在架物品不全的印象,例如牙签品牌感知度高品:在购买时用户决策树受品牌影响,例如,饮用水用户倾向选择农夫山泉、怡宝等知名大品牌根据这几大类再去做影响因子的权重配比(根据商家要求及关注度、业务实际场景考虑),常见几种会影响选品决策的因子:从商品维度:既往销售指标:针对已经营过商品的销售量、销售额、毛利、销售增长、动效率...投入产出比指标:投入多少促销力度、陈列资源,获得多少销售反馈。例如盒马将线上和线下表现合在一起创造坪效奇迹市场调研、舆情数据:这个主要针对于新品的挖掘,通过外部舆情分析获得市场最新变化趋势,结合竞争对手热卖,对新品选择策略的影响权重高。例一些网红商品商圈表现:这个主要针对线下选品,根据门店所处位置强化某品类的单品配比,例如位于学校附近的门店售卖文具较多,CBD附近的门店售卖加工熟食、快餐较多从用户行为表现维度:关联购买:通过用户经常一起购买商品选出组合销售或关联陈列的商品,尿布和啤酒的经典案例不用我说啦。线上有很好的优势,例如我们逛某品A的时候,下面会有推荐文案:xx%的用户也会购买B。提醒我们买全商品,并带来更多付费复购数据:从用户的复购行为、购买频率,得到高复购、高频购买商品,商家喜欢这样的商品,可以为他们重复制造价值用户近期线上搜索行为数据:即代表近期用户需求、市场热度趋势,又能强关联影响线上选品。例如热搜(疫情期间口罩、消毒酒精)、搜索无果(代表当前选品未满足用户所需)、搜索增长(代表市场变化趋势,可提早警觉)用户近期线上点击行为数据:这部分数据可以用于调试模型,增加算法逻辑及参数。这个理解稍微困难些,举个例子说明,如果用户在洗发品类下更多倾向于点击功效(防脱、柔顺、去屑等)进行选择,其次品牌、规格,那在选品时,洗发品类的影响因子权重会调整为:功效>品牌>规格建议售卖商品如何通过选品决策和算法模型得到建议售卖的商品清单。通俗来说,通过一些前置条件进行选品限制,再结合不同业务场景、不同商品属性标签,在多种影响因子作用下,从商品库中选出建议上架商品,并获得更高收益。06效果复盘,数据反哺完成选品决策后,很关键也很容易被忽略的一步便是对选品效果复盘,可参考销售增长表现,并将表现差强人意的品类拿出来,单独下钻具体单品数据,根据失败数据调整模型,并将反哺更多数据便于机器学习。作者:@Snowki
2021年3月17日
其他

无脑带你遍历用户生命价值与流失挽救(上) : 流量下的价值套路

这是一篇讲述用户生命周期与流失挽救方面知识的文章,穿插了大量的从BI角度对业务进行数据分析的方法。相关知识的宽度与深度有点高,涉及到的知识点有:用户生命周期、流量方向的分析方法论、用户分群、用户挖掘、算法、渠道归因、拉新、端承接、运营、产品等。除了遍历这些知识外,文章的核心部分是关于两个数据产品的(关于数据产品方向文章没有做更多阐述)。
2020年7月8日
其他

一文读懂主成分分析(PCA)

专注大数据、人工智能、移动/互联网、IT科技、电商/金融、数据分析/挖掘等领域的综合信息服务与分享平台。合作/约稿请联系QQ:
2020年6月1日
其他

推荐 :为你介绍7种流行的线性回归收缩与选择方法(附代码)

回顾与结论由于模型参数存在很大的方差,线性模型具有许多可能相关的特征,导致预测精度和模型的可解释性方面较差。这可以通过减少方差来缓解,这种方差只会以引入一些偏差为代价。然而,找到最佳的偏差
2019年5月13日
其他

数据科学实践中常犯的十二种错误

如果是初学者,当你参加数据科学项目时,应避免以下十二种常见错误。1没有检查你的数据你需要检查自己即将收集/使用的数据的量与质。“你的工程中大部分的时间,通常是80%的时间,将用于获取和清洗数据,”data.world的数据科学家和知识工程师Jonathan
2018年9月13日
其他

推荐 :数据可视化与信息可视化浅谈

我们常常迷失在数据中,纷繁复杂的数据让我们无所适从。可视化作为解决这问题的有效手段,通过视觉的方式让数字易于理解。数据可视化和信息可视化都是可视化的一种方式,数据可视化将数据库中每一个数据项作为单个图元元素表示,大量的数据集构成数据图像,同时将数据的各个属性值以多维数据的形式表示,可以从不同的维度观察数据,从而对数据进行更深入的观察和分析。信息可视化,旨在把数据资料以视觉化的方式表现出。信息可视化是一种将数据与设计结合起来的图片,有利于个人或组织简短有效地向受众传播信息的数据表现形式。本文梳理了可视化相关内容,并且根据数据平台组同仁们在可视化项目过程中使用经验,总结一些可视化使用注意事项,与大家分享。数据可视化的图表类型简介数据可视化有很多既定的图表类型,下面我们分别来谈谈这些图表类型,他们的适用场景,以及使用的优势和劣势。1.柱状图适用场景:它的适用场合是二维数据集(每个数据点包括两个值x和y),但只有一个维度需要比较。优势:柱状图利用柱子的高度,反映数据的差异。肉眼对高度差异很敏感,辨识效果非常好。劣势:柱状图的局限在于只适用中小规模的数据集。2.折线图适用场景:
2018年8月9日
其他

推荐 :大数据下的用户与价值分析

Distribution)。1、观察随机模型曲线形状均由其参数a、b、p、q、k决定。频率概率分布列符合负二项分配,参数a、b由客户的平均购买频率计算出来。假设有一组样本,对应n家成交客户,fi(i
2018年7月23日
其他

干货 :深入浅出之推荐系统原理应用介绍

系统性阐述用户画像数据建模方法。提到大数据,不能不说用户画像。经常看到有公司这样宣传:“掌握了千万用户的行为数据,描绘出了极其有价值的用户画像,可以为每个app提供精准的用户数据,助力app推广。”
2018年7月18日
其他

Google 科学家亲授:如何成为数据分析抢手人才?

加入课程后,你将从零开始,熟悉符合硅谷标准的数据分析流程,掌握从数据清洗到数据可视化各环节的关键技能,最终成为顶尖数据分析师,获得Facebook、Tableau
2017年9月12日
其他

超级干货 :一文读懂聚类算法

(聚类),简单地说就是把相似的东西分到一组,聚类的时候,我们并不关心某一类是什么,我们需要实现的目标只是把相似的东西聚到一起。因此,一个聚类算法通常只需要知道如何计算相似度就可以开始工作了,因此
2017年8月28日
其他

从0开始搭建自己的数据运营指标体系--运营活动分析

工作中,我们的产品每月都会涉及大大小小的活动。做了那么多的活动分析,你真的明白什么是活动分析吗?小编梳理以往活动分析经验,从什么是活动分析?活动数据跟进?以及怎么做活动分析对活动分析做个简单的复盘。
2017年8月22日
自由知乎 自由微博
其他

关于用户画像那些事,看这一文章就够了

数据清理,数据清理的过程通常位于Hadoop集群,也有可能与数据收集同时进行,这一步的主要工作,是把收集到各种来源、杂乱无章的数据进行字段提取,得到关注的目标特征。
2017年7月21日
其他

实战 :为自己的公号搭建一个数据运营指标体系

专注大数据、人工智能、移动/互联网、IT科技、电商/金融、数据分析/挖掘等领域的综合信息服务与分享平台。合作/约稿请联系QQ:
2017年7月10日
其他

系列 :从数据指标到数据运营指标体系

至此,从零开始搭建自己的数据运营指标体系理论部分完成。后续将以一个完整的案例作为此部分的结束,后续内容将是从具体业务着手介绍数据运营指标体系的搭建过程。
2017年6月27日
其他

系例 :数据指标的构建流程与逻辑

开发人员拿到需求表后会评估数据需求,根据不同的业务类型及数据来源,数据开发人员会选择内部开发或是采购外部第三方数据产品服务。这些产品或服务最终反馈为的就是相应的数据指标以及对应的相关数据报表。
2017年6月12日
其他

干货 : 聚焦于用户行为分析的数据产品

意即:知道哪些人在使用你的产品,并且可基于他们的行为向他们发送自动邮件。无疑,这些邮件只所以自动,背后是有一套规则,比如定期向长久不来的用户发送唤醒邮件,或者向近期比较活跃的用户发送新版本测试邀请。
2017年6月9日
其他

如何构建大数据层级体系,看这一文章就够了

其实大家不用知道每一块的含义是什么,如果你想知道的话可以自己去百度。我这里主要讲的是你要有数据采集,数据存储,之后怎么去处理,然后怎么去使用数据,最终让我们搜集的数据和运营出来的数据达到一个循环。
2017年6月8日
其他

系列 :从0开始搭建自己的数据运营体系(业务理解篇)

前面开篇介绍了从0开始搭建数据运营指标体系的概况【数据运营指标体系】与数据运营定位篇【数据运营指标体系-定位篇】(点括号标题查看上篇文章);今天我们重点来关注下数据运营对业务理解能力重要性。
2017年6月5日
其他

推荐 :最用心的运营数据指标解读

Click)指每用户点击成本,按点击计价,对广告主来说,这个比CPM的土豪作派理性多了。也有很多人会认为,CPC不公平,用户虽然没有点击,但是曝光带来了品牌隐形价值,这对广告位供应方是损失。
2017年5月25日
其他

系列 :从0开始搭建自己的数据运营指标体系(定位篇)

单纯的数据提供产品技术就能解决,而这个过程中数据运营更多的职责在数据翻译上,这里的数据翻译可从前后两方面理解:在对业务端,承担着数据指标建设与解读职责,在产品技术端,承担着数据需求提供的职责。
2017年5月22日
其他

运营入门,从0到1搭建数据分析知识体系

数据分析并没有想象中的高不可及,掌握好相应的概念、思路、流程,运营都可以做好数据分析。这里要着重强调一点,数据分析的目的是指导业务实践;脱离实践的数据分析、为分析而分析的数据分析都是在耍流氓。
2017年5月18日
其他

80%的运营注定了打杂?因为你没有搭建出一套有效的用户运营体系

美团的地推团队以其强大高效的线下推广能力著称于世,被称为地推铁军,对于O2O产品,商家用户的开拓起着至关重要的作用,当年的千团大战,为什么如今活下来的没有几家,这跟执行力有很大的关系。
2017年5月16日
其他

干货 :从0开始搭建自己的数据运营指标体系

数据框架在数据指标体系中通常解决“是什么”以及“为什么”问题,通过KPI目标的拟定,结合一些管理运营模型,通过目标指标拆分的方式完成初步指标搭建,这个过程中拆分主要跟据目标目的而定。
2017年5月8日
其他

做运营必须掌握的数据分析思维,你还敢说不会做数据分析?

自下而上的数据分析思路多用在针对已有数据报表中的数据问题发现,具体思路为:异常数据发现——该异常数据影响因素——影响因素与问题数据之间的相关关系——找出出现异常数据的原因——找到异常数据的解决办法。
2017年5月4日
其他

干货 : 揭秘信息可视化图表的设计方法

信息图表不仅优化了传统的图文阅读方式,而且已经成为当下视觉传达发展的必然趋势。信息图表不仅把枯燥的文字、数据变成美好的阅读体验,而且刷新了设计师们的设计思维方式,焕发出他们更丰富的设计潜能。
2017年5月2日
其他

干货 :从0到1搭建数据运营体系

中出现了106次,遥遥领先。接下来是分别是「分析报告」、「提供数据」、「数据报表」等词,这也说明提供数据报表、分析报告是数据运营的重要工作。搭建「数据指标」、及时「发现问题」、提供「解决方案」也是
2017年4月26日
其他

干货 :从0到1搭建数据运营体系

中出现了106次,遥遥领先。接下来是分别是「分析报告」、「提供数据」、「数据报表」等词,这也说明提供数据报表、分析报告是数据运营的重要工作。搭建「数据指标」、及时「发现问题」、提供「解决方案」也是
2017年4月26日
其他

干货 :解读产品、运营和数据三个基友关系

单车距离的远近会影响需求,天气会影响需求,过去的体验也会影响。产品提供的解决方案既要满足用户需求的最低下限,也需要考虑用户愿意为之支付的成本。这个成本可以是用户体验,也受限于各类因素。
2017年4月20日
其他

浅析 :人工智能与机器学习

http://dataconomy.com/2017/03/artificial-intelligence-heres-need-know-understand-machines-learn/
2017年4月18日
其他

干货 :数据分析团队的搭建和思考(途家网 BI 总监)

这个时候创始人已经没有足够的时间去看大量的数据了,所以我们有了第一个专职的数据分析人员。全公司第一个专职的数据分析人员非常关键,因为这个人在很大程度上决定了整个公司之后在数据方面的如何发展。
2017年4月14日
其他

干货 :手把手教你搭建数据化用户运营体系

在以上用户参与度指标中,我们可以选取一个可以反映主运营目标的指标,如消费额,搭建用户等级模型(用户分层),也可以选取多个相关指标,如最近一次消费时间R,消费频率F,消费额M搭建常用的RFM用户模型。
2017年4月12日
其他

从底层到应用,那些数据人的必备技能

对于数据分析师的定位:个人认为,成为优秀的数据分析师是非常难的,现在市面上也没有多少优秀的分析师。数据分析师的技能要求,除了会数据分析、提炼结论、洞察数据背后的原因之外,还需要了解业务,懂算法。
2017年4月11日
其他

干货 : 如何构建数据运营指标体系

在运营工作中,我们接触到不同种类的数据指标,这些指标往往都是已经设定好的,我们只需要根据指标推动业务发展。那么,我们如何分辨这些数据指标是否科学呢?这些数据指标体系是否符合业务发展需要呢?
2017年3月28日
其他

经典重温 :数据驱动决策的13种思维

建议大家养成一个习惯,经常计算指标间的相关系数,仔细思考相关系数背后的逻辑,有的是显而易见的常识,比如订单数和购买人数,有的或许就能给你带来惊喜!另外,“没有相关关系”,这往往也会成为惊喜的来源哦。
2017年3月22日
其他

从零开始,构建数据化运营体系

把握当下,是能获得数据的立即反馈。你要推广一个活动,可以提前挑选5%的用户做一个测试,及时获知用户的反馈,转化率高不高,响不响应,然后按照数据决定后续的运营是继续还是改进。这是技术带来的进步优势。
2017年3月16日
其他

读懂用户运营体系:用户分层和分群

上图是一个简化的游戏用户分层,每层指标都是可量化的。为了上下层用户清晰,群体间应尽量独立,即计算RMB玩家时,应该把土豪玩家排除,计算普通玩家时,应该把结果中包含的上两层排除,这样运营的针对性才强。
2017年3月13日
其他

推荐 :三步让你抓娃娃概率提升800%

之前我解释出奖率为40次必出一个娃娃,其实也可以理解为40次只出一个娃娃,现实就是,按照设定,你得在一个娃娃机前抓40次,才能抓到这个娃娃。一般娃娃机两元一次,等于你花80元才能钓到这个娃娃。
2017年2月8日
其他

干货 :美团推荐系统整体框架与关键工作

Groves模型,另外也在探索FTRL这样的在线学习模型。AG模型是一种决策树类型的模型,属于非线性模型。这种非线性模型的特点,是一定程度上能够自动进行特征组合的工作,不需要人工进行大量这类工作。
2015年9月8日