查看原文
其他

这可能是一篇数据化运营的大纲

2017-09-16 秦路 R语言中文社区

点击上方图片查看配套视频教程

作者:秦路,天善智能特约专家。资深数据分析师,数据化运营专家。擅长结合运营和数据,建立数据化运营体系。

个人公众号:秦路(微信ID:tracykanc)


今天是3.15,作为一个长相靠谱、内容靠谱,更新时间不靠谱的公众号运营者,没有被大家投诉,我很欣喜。

本篇文章的主题,是数据化运营。在写完从零开始,构建数据化运营体系后,我一直在想,能不能写得再好一点?

我胸中有很多付诸笔端的想法在鼓动,虽然在近两年的工作中,数据化运营是最得心应手的工作,但是写出来总差那么一点意思。另外一个角度看,是不够融会贯通。

于是我希望,在七周成为数据分析师的系列后,把数据化运营作为第二个系列来完成。每次写文章,对自己也是一种总结和提升。

下面是一份「简略」的大纲,更恰当地说是草稿。当不久的将来开始正式写作时,肯定会更好。

我们将数据化运营分成四个环节:数据收集,数据加工,数据运营,数据反馈。它是运营和产品视角的闭环。

将闭环简化成四个模型,那么它们分别是:

数据收集:以用户和产品的交互为输入,原始数据(行为、业务、流量、外部)为输出。

数据产品:以原始数据为输入,以加工数据(标签、画像、维度、指标、算法结果)为输出。

数据运营:以加工数据为输入,以运营策略(用户、内容、活动、电商)为输出。

用户触达:以运营策略为输入,以反馈行为(转化率、点击率、响应率)为输出。

数据收集

虽然数据收集是技术的事,但是产品和运营人员也应该了解相关的细节。什么是网页参数,什么是服务器日志,数据是如何被收集起来的…下图就是一段服务器日志,是收集数据的方式之一。

255.255.255.255 - - [18/Sep/2016:00:00:00 +0000]

"GET /images/my.jpg HTTP/1.1" 200 19939

"http://www.aaa.cn/bbb"

"Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/29.0.1547.66 Safari/537.36"

如果不了解,当你问到研发:为什么这一块数据没有收集到啊,研发大哥只会翻一个白眼说:你没有要求布置啊。

布置即是埋点,埋点不是一项新兴的技术,它在Web时代就有了。

很多场景中,业务方是埋点需求的发起者。这也是我强调的,运营和产品需要了解埋点,否则,这一块很容易变成坑。

在数据化运营体系,对埋点的要求只会更高。前端埋点、后端埋点、可视化埋点、服务器埋点,各类方式层出不穷。技术问题不需要担心,担心的是应用。

虽说,给我一组行为埋点数据,我用Excel也能写出协同过滤。可如何最大价值的发挥效用,在埋点初期就应该考虑清楚。所以埋点需要花稍微多一点的篇幅介绍。

最后,学会爬虫,爬虫是一种高性价比高体力活的技能。爬虫有三种主要方式,静态网页爬取,JSON/API爬取,动态JS爬取,再加上各种反爬虫机制的应对。当爬虫水平能爬取微信和淘宝时,已经是草木竹石皆可为剑了。

利用爬虫,运营能做很多好玩的事情。比如出现一个热点新闻,大家马上抓取相关数据,然后新媒体同学洋洋洒洒一篇文章:《大数据告诉你,XXX是什么样的》,《我们分析十万条影评后,得出这部电影XXX》,《XX网站最火热的十条内容》。比憋内容好多了。

 数据加工

这依旧是技术研发的范畴。

数据加工的业务核心是指标,我们首先得熟悉各种主流指标的含义和应用。

很多产品运营们会问,是否需要理解数据架构?


上图是网上扒来的数据架构,好消息是并不需要学会。但你总归要理解一个概念,比如什么是MapReduce,什么是离线什么是实时,什么是缓存,什么是T+1。

这是为了降低沟通成本,也是方便大家理解数据化运营背后的逻辑。为什么有些报表和数据不能立马获取,为什么有些个性化推荐,如网易云音乐,只能每天定时更新?

一个好的数据化运营体系,需要业务人员和技术不断磨合才能搭建起来。此时,你也会是一位合格的数据产品经理了。

一些数据产品的设计逻辑可以选择性学习,包括用户画像、广告、CRM等。它们在一定程度上是相通的,比如用户画像和广告的人群定向,区别于静态和动态。

用户画像是集大成者的时髦应用,不同公司的用户画像也不相同。有些用NoSQL、有些则是宽表。用户画像应基于业务出发,切记避免形式主义的画像,你卖保健品的,知道用户喜欢军事有什么用?

机器学习是更时髦的应用,我认为,产品和运营了解些机器学习相关的知识挺有帮助,这是数据化运营的方向之一。

当你理解机器学习/数据挖掘能够做什么,你才能与数据、技术配合它落地。永远别期待数据部门凭空优化业务,他们需要业务部门提供方向和指导。一个懂机器学习的运营,起码值他们请三顿饭。

话说回来,单纯理解,哪怕是一个文科生,一个月也能懂几个主流的算法模型了。比如决策树,就是if-then的集合,非常简单,因为简单,所以运算速度快,速度快就可以应用在一些特定的场景,比如新用户的内容推荐系统。这种理解,有助于设计更好的产品。

所以,得让产品和运营们,也了解起机器学习啊。

数据运营

终于轮到业务的环节,这里将着重介绍如何将数据转换成策略。

首先,需要数据化运营的思维。如果运营还是用老虎机、大转盘、抽宝箱的「三板斧思维」,业务走不长远。

我曾经说过,运营和Growth Hacker只差一个数据运营的距离。无需特地吹捧国外的增长黑客,只要数据化用的好,人人都是增长黑客嘛,哈哈。

接下来以实际的工作内容解构数据化运营。

用户运营的数据化,分为用户行为和用户体系。

用户行为通过埋点数据分析。


桑基图是最合适的图表(偷懒拿旧图了),上图只是活跃状态的变化。不妨想一下,同样的图表,用来分析用户在产品上的操作路径,比如某个功能模块的使用、退出、跳转,是否能优化产品呢?

除了行为,还要挖掘用户数据,之前一篇文章的分层和分群,就是其中之一。另外也包括用户流失预测等。

活动运营,我准备把流量合并在这块,因为活动都是Web页面的形式,两者的道理是相通的。这块也有不少专门的技巧。

大家知不知道,微信会在第三方分享出来的web页面上,打上&from=timeline、groupmessage、singlemessage的参数。分别对应朋友圈分享、群分享、好友分享。大家有没有研究过,哪些运营活动或者内容,更容易被分享到朋友圈,哪些内容更容易被分享到群?如果加上用户参数,你还能监控到哪类用户的分享效果特别好。我就基于此AB测试优化朋友圈的内容点击率,提高了30%左右。

同样的,活动运营也能用统计学进行优化,怎么计算活动中奖的概率模型,预估成本?它是典型的二项分布。不同的中奖概率,对应什么样的用户数学期望?如何调整概率达到效果最优,玩法也有很多。

内容运营是数据化的一个难点,因为文本很难量化。从大层面考虑,我们能监控舆情数据,而细节,我们将进行文本分析。

不需要专门学会自然语言处理。而是当用户评论你的产品时,如何判断他们评论的情绪是积极还是消极?当评论有十万条时,怎么去更好的分析?

除了上述最主要的工作内容,我们还要学习商业化运营。这里的商业运营,是涉及到各类营收、GMV的运营策略。包括电商、广告、会员等。

除了技巧,得花些时间,把策略变成产品和工具。这一块,就涉及到运营后台/平台的搭建了。

数据反馈

最后就是数据反馈了。

AB测试是数据化运营的大杀器。好的AB测试,需要设计相应的运营策略。如何设置对照组和控制组,如何划分出流量,怎么样的样本才能满足置信度的要求。何种手段能够证明运营策略成功了?

除了AB测试,得继续熟悉各类反馈指标,点击率、转化率、响应率。包括机器学习的精确率、准确率、召回率、AUC和ROC曲线、Lift提升图。这会把大家的思维,从单纯的转化,带到更高层的维度。

比如用户购买商品,转化率是30%,这是普通运营的视角。数据化运营会怎么看待这个数据呢?他会把用户切割到一个维度,叫做购买可能性。比如用户有90%的可能性购买,用户有80%的可能性购买,用户有10%的可能性购买…这些可能性都是机器学习预测出来的概率,不同概率的转化率不同。最终划分出一个区间,譬如选择40%以上可能性的用户才去做强营销。

好的运营平台,运营人员会获得这类基于预测的数据,告诉你用户对某些运营活动、策略、营销的响应会怎么样,运营人员就基于此选择用户,做到性价比最优化。

于此,数据化运营是阶段性的结束了,之后则是优化改进策略,作为新的开始。

这一次,我还希望,大家一起来完成。大家提出工作中的问题,你觉得哪个业务环节可以数据化运营,或者欠佳,或者做的好,都可以告诉我。因为数据化是以业务为核心,我没有各个领域的经验,所以更愿意倾听一线业务的反馈。

当然,提问的解答,也是有优先度的,因为我精力有限,具体参照就是打赏了。

抽空我把大纲的思维导图写好发出来吧。

想了解更多干货就使劲戳戳戳~~~

天善智能年度数据分析扛鼎之作,秦路主讲,七周成为数据分析师课程。
人气讲师,期盼已久,潜心打造,不负众望!
涵盖基础、业务、思维、工具、方法等方面皆具,提纲挈领!
给自己一段七周之旅,奠定基石基础,踏上数据分析师之路!

点击阅读原文或扫码咨询

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存