查看原文
其他

数据驱动运营决策-框架与方法(上)

胡淏 数据森麟 2019-02-23

胡淏,毕业于哥伦比亚大学统计系,现任滴滴参谋部-资深数据专家。专注于数据驱动的解决方案,提供机器学习、因果推断、平台经济学领域专业咨询。数据森麟(ID:shujusenlin)公众号特邀作者。

本文首发于今日头条机器知心专栏:https://www.toutiao.com/i6556025054855954952,感谢作者的授权,允许本公众号发布这篇文章,本文对于互联网行业中的运营、产品、算法同学都会有一定的帮助,让大家能够更加清晰自己所做的项目对公司的价值,真正做到科学的数据化运营。

文章包含非常多的干货,我们将分上、下两次在公众号中与大家分享,上半部分主要与大家分享如何在企业内建立合理的量化项目价值的框架,下半部分会主要与大家分享如何基于合理的框架去评估项目的价值,下面进入正文。


如果大家在一线做算法或者分析,基本上工作时间基本上都花在具体的项目推进和优化上面。我之前也是这样的状态:作为某公司算法策略 manager,投入到公司内部的一些重要的机器学习项目里面,每天的讨论都在围绕着具体项目的预测精度,特征工程,线上部署与监控这些问题。也写了一篇文章 《机器学习模型优化不得不思考的几个问题》,介绍了模型项目推进的三个要素。

不过慢慢的,有一些更上层的问题问题让我感到头疼:做的这些事情,我清楚业务和老板定下来的目标是什么。不过,目标是否可能错了?目标应该是什么?又给企业带来了多少价值?当时我并没有一套行之有效的方法论可以帮助我去想清楚一个项目的目标,并去量化一个项目的价值。

于是,这一年多以来,我从管理回到一线,在参谋部重点做两件事情:和这个领域内的教授、专家学习一些可以解决这些问题的分析框架和计量经济学的方法(特别感谢 万智玺 老师的栽培),用这些方法去评估公司一些重要的项目与产品的边际价值、潜力,去指导运营做更高效的规划。

今天我具体来聊的,就是如何清晰的思考和科学的量化项目的价值,如何优化项目目标从而更高效的完成业务的 KPI。而且我讲的不是管理学的经验,而是科学的、数据驱动的方法论。比如,在海外,对标竞争对手的司乘体验水平,如果要达到 x% 的 market share 最少需要多少在线司机和发单?这是一类偏战略分析、运营规划的问题,解决这类问题不仅仅需要技术能力,也需要对商业模式清晰的思考、以及一个项目在商业模式下的位置以及价值. 这构成了本次内容要涵盖的三个主体:

  • 分析框架:多边平台的经济学框架;

  • 项目定位:模型的两类应用、价值、风险;

  • 技术选型:因果推断与机器学习。

多边平台的分析框架

随着技术的发展,互联网+催生了大量的平台类商业模式。这些平台的运营、产品可能相差很远,但是背后的理论模型却极为相近。绝大多数的互联网公司——无论是 BATJ、独角兽、还是那些风口浪尖的企业,都可以类比成或大或小、或纷乱或简单的市场。在这个市场上都有卖家和买家双方,而平台的作用就是去撮合买家和卖家之间的交易

举例说,滴滴的卖家是司机,买家是乘客,平台分配合适的司机去满足乘客的出行需求;饿了么、美团则是用户、餐饮店、骑手端组成的三边平台,这是个在线上将有外卖需求的用户和餐饮店之间进行匹配交易,并通过配送完成外卖交易闭环的运营模式。

平台之所以可以兴盛,因为它解决了传统行业交易成本过高的难题。经济学家根据交易的三个阶段,把交易成本划分为匹配、谈判、缔约、执行成本。比如你出门打出租车,匹配成本发生在你寻找潜在交易机会的阶段,你从出门扬招到找到一个可能载你的空车这个过程所产生的成本就是匹配成本;谈判、缔约成本发生在买卖双方针对交易细节进行协商的过程,就是你和司机商量要去哪里,是否接受拼车,是否愿意加价的过程中产生的成本;而执行成本呢,则在于交易发生之后,司机是否会绕路,是否会中途让你下车,这些你们所承担的风险就是执行成本的一种。

滴滴的优势在于利用互联网大数据、精细化运营的手段极大程度上降低了交易成本:把司机和乘客从线下搬到了线上,通过秒级的分单调度匹配司机与乘客,通过平台统一定价节省了司机与乘客之间议价的成本,并通过司机服务分、乘客信用分来反向约束司机和乘客的行为。就是因为滴滴解决了高昂的出行交易成本,滴滴出行目前是全球最大的一站式出行平台,每天 3000 万订单的规模。

经济学家把平台类商业模式,或者说撮合供需两(多)端交易的商业模式统称多边平台 (Multisided Platform)。多边平台有很多有趣的问题,例如低于成本的定价依然可以获得巨额的利润,又比如多边之间的网络效应带来的协同增长、萎缩;另外,平台的规模以及获取交易、用户行为数据的能力为机器学习算法提供了非常好的生态...... 不过,这里不会翻来覆去说多边平台的复杂,而是其背后是一套简单、科学的分析框架:KPI(主要是规模、体验)= f(供给量)+ g(需求量)+ u(匹配效率)。f(供给量)+ g(需求量)在讲的是边际供给、需求对平台 KPI 的影响;而 u(匹配效率)在讲的是给定一定规模的供给量和需求量之后,平台撮合供给 和 需求而实现规模、或体验的效率。一个平台要做规模或者体验的增长,只有两个抓手:要么进一步拉动供需规模;要么做匹配效率的优化


如果大家周围有对数据分析&数据挖掘感兴趣的朋友,欢迎在朋友圈分享&转发一下,让更多的朋友加入我们。有好的文章也可以联系我与大家分享,需要获取代码转载本公众号文章,可以直接在公众号或者文章下方留言

往期文章

“水泊梁山“互联网有限公司一百单八将内部社交网络

R爬虫&可视化第四季-近三十年6000部国产电视剧告诉了我们些什么

R爬虫&可视化第五季-图解欧洲足球五大联赛

Python爬虫&可视化第1季-城市旅游数据分析

Python爬虫&可视化第2季-舌尖上的“小龙虾”

人工智能在京东金融中的应用


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存