一文读懂如何通过指标理解数据驱动

Original 晓晓数据驱动智能

2024-09-16

数据可以帮助企业做出更好的决策。不幸的是，大多数公司更擅长收集数据，而不是解读数据。他们声称拥有数据驱动的文化，但实际上他们严重依赖经验来做出判断。

作为数据科学家，应帮助企业的业务利益相关者理解和解释数据，以便他们做出更明智的决策。

数据的影响力并非来自于所做的分析或构建的模型，而是来自于帮助推动的最终业务成果。这是高级数据科学家与初级数据科学家的主要区别。

为了实现这一点，根据Rippling、Meta和Uber将数据转化为可操作见解的经验，整理出本文以供参考。

本文将介绍以下内容：

要跟踪哪些指标：如何为企业建立收入公式和驱动树。
如何跟踪：如何设置监控并避免常见的陷阱。如何选择正确的时间范围、处理季节性、掌握群组数据等。
提取见解：如何以结构化且可重复的方式识别问题和机会。最常见的趋势类型，以及如何理解它们。

听起来很简单，但细节决定成败，让我们一一深入研究。

第1部分：要跟踪哪些指标

首先，需要弄清楚应该跟踪和分析哪些指标。为了最大限度地发挥影响力，应该关注那些真正推动收入增长的指标。

从高级收入公式开始（例如，对于基于广告的业务，公式为“收入=展示次数*CPM/1000”），然后进一步细分每个部分以找到潜在的驱动因素。确切的收入公式取决于企业的业务类型。

生成的驱动树（输出在顶部，输入在底部）会展示业务结果的驱动因素以及需要构建哪些仪表板，以便进行端到端调查。

示例：以下是基于广告的B2C产品的（部分）驱动树：

了解领先指标和滞后指标

收入公式可能使投入看起来立即转化为产出，但事实并非如此。

最明显的例子是营销和销售漏斗：生成潜在客户，他们转变为合格机会，最后达成交易。根据业务和客户类型，这可能需要数月时间。

换句话说，如果正在查看收入等结果指标，那么通常会查看几周或几个月前采取的行动所产生的结果。

根据经验法则，在驱动树中越往下走，指标的领先指标就越多；在驱动树中越往上走，处理的滞后指标就越多。

量化滞后

值得查看历史转换窗口以了解所处理的滞后程度。

这样，将能够更好地进行逆向工作（如果发现收入波动，就会知道要追溯到多久以前寻找原因）以及进行前瞻性预测（将知道需要多长时间才能看到新举措的影响）。

根据经验，制定经验规则（新用户平均需要一天还是一个月的时间才能活跃起来）将带来80%-90%的价值，因此无需过度设计。

第2部分：设置监控并避免常见陷阱

所以你有你的驱动树；你如何使用它来监控业务绩效并为利益相关者提取见解？

第一步是设置一个仪表板来监控关键指标。

1.为每个指标选择合适的时间范围

虽然您希望尽早了解趋势，但需要小心，不要陷入查看过于细致的数据并试图从大部分噪音中获取见解的陷阱。

考虑您正在衡量的活动的时间范围以及是否能够根据数据采取行动：

实时数据对于Uber这样的B2C市场很有用，因为1）交易的生命周期很短（Uber乘车通常在不到一个小时内请求、接受和完成）和2）因为Uber有实时响应的工具（例如峰值定价、激励措施、司机通讯）。
相比之下，在B2BSaaS业务中，由于交易周期较长，每日销售数据将会很嘈杂且可操作性较差。

您还需要考虑针对指标设定的目标的时间范围。如果您的合作伙伴团队有月度目标，那么这些指标的默认视图应该是月度。

但是：月度指标（甚至更长时间段）的主要问题是，只有很少的数据点可供使用，并且必须等待很长时间才能获得更新的性能视图。

一个折衷方案是在滚动平均值的基础上绘制指标：这样，您将了解最新趋势，但通过平滑数据消除大量噪音。

示例：查看左侧的月度数字，我们可能会得出结论，我们有能力实现4月份的目标；然而，查看30天滚动平均值，我们注意到收入产生量急剧下降（我们应该尽快深入研究这个问题）。

2.设定基准

为了从指标中获得见解，需要能够将数字置于上下文中。

最简单的方法是随着时间的推移对指标进行基准测试：指标是在改善还是在恶化？当然，如果知道指标的确切水平，那就更好了。
如果针对该指标设定了正式目标，那很好。但即使没有，仍然可以通过推导隐含目标来判断自己是否走在正轨上。

示例：假设销售团队有每月的配额，但他们没有为达到配额需要生成多少渠道制定正式目标。

在这种情况下，可以查看开放渠道与配额的历史比率（“渠道覆盖率”），并将其用作基准。请注意：通过这样做，隐含地假设绩效将保持稳定（在这种情况下，团队正在以稳定的速度将渠道转化为收入）。

3.考虑季节性

在几乎所有业务中，都需要考虑季节性才能正确解释数据。换句话说，查看的指标是否具有按一天中的时间/一周中的日子/一月中的时间/日历月重复的模式？

示例：查看B2B SaaS业务中新ARR的每月趋势：

如果您通过这张简单的条形图查看7月和8月新ARR的下降情况，您可能会感到震惊并开始进行深入的调查。

然而，如果你把每一年的数据放在一起绘制，你就能找出季节性模式，并意识到每年夏季都会有一个淡季，你可以预计九月份业务会再次回暖：

但季节性不一定是每月一次；可能是某些工作日的表现较强或较弱，或者通常会看到业务在月底回升。

示例：假设您想查看销售团队在本月（4月）的表现。这是本月的第15个工作日，目前的收入为26,000美元，而目标是50,000美元。忽略季节性因素，看起来团队会错过这个机会，因为您只剩下6个工作日了。

然而，您知道团队往往会在月底完成很多交易。

在这种情况下，我们可以绘制累计销售额并与前几个月进行比较，以了解模式。这让我们看到，由于轨迹不是线性的，我们实际上在这个月的这个时候处于一个稳固的位置。

4.处理“过程”指标

分析指标时最常见的陷阱之一是查看那些还没有足够的时间“烘焙”即达到其最终值的数字。

以下是一些最常见的示例：

用户获取渠道：你正在衡量从流量到注册再到激活的转化率；你不知道最近注册的用户中有多少会在未来转化
销售漏斗：您的平均交易周期持续数月，并且您不知道最近几个月的未完成交易中有多少仍会完成
留存率：你想了解特定用户群体对你的业务的留存情况

在所有这些情况下，最近的群体表现看起来都比实际情况更差，因为数据尚未完整。

如果您不想等待，通常有三种方法来解决这个问题：

选项1：按时间段划分指标

最直接的方法是按时间段划分汇总指标（例如第一周转化率、第二周转化率等）。这样，您可以在进行同类比较的同时获得早期读数，并避免对较老的群体产生偏见。

然后，您可以在群组热图中显示结果。以下是跟踪从注册到首次交易的转化的获取渠道示例：

这样，您可以看到，从同类比较来看，我们的转化率越来越差（我们的第一周CVR从20%以上下降到最近几批的15%左右）。如果只看总转化率（最后一列），我们无法区分实际下降和不完整数据。

选项2：更改指标定义

在某些情况下，您可以更改度量的定义以避免查看不完整的数据。

例如，您可以查看3月份成交的交易中成功和失败的交易数量，而不是查看3月份成交的交易中成功和失败的交易数量。这个数字不会随时间而变化，而您可能需要等待数月才能看到3月份交易的最终表现。

选项3：预测

根据过去的数据，您可以预测某个群组的最终表现。时间越长，收集的实际数据越多，预测就越接近实际值。

但要小心：预测群组表现时应谨慎行事，因为很容易出错。例如，如果您从事赢率较低的B2B业务，那么一笔交易可能会显著改变群组的表现。准确预测这一点非常困难。

第3部分：从数据中提取见解

所有这些数据都很棒，但我们如何将其转化为见解呢？

您没有时间定期深入研究每个指标，因此请优先考虑时间，先查看最大的差距和变化因素：

哪些球队未能实现目标？你认为哪些球队表现超出预期？
哪些指标正在下滑？哪些趋势正在逆转？

一旦您选择了感兴趣的趋势，就需要深入研究并找出根本原因，以便您的业务合作伙伴可以提出有针对性的解决方案。

为了为深入研究提供结构，我将介绍您将遇到的指标趋势的关键原型，并根据现实生活中的经验为每个原型提供切实的例子。

1.网络中立运动

当您看到某个指标出现剧烈变动时，请先向上查看驱动因素树，然后再向下查看。这样，您就可以看到该数字是否真正影响了您和团队最终关心的问题；如果没有，那么找到根本原因就没那么紧迫了。

示例场景：在上图中，您看到网站上的访问到注册转化率大幅下降。您没有惊慌，而是查看了总注册人数，发现该数字保持稳定。

事实证明，平均转化率的下降是由于网站低质量流量激增造成的；而“核心”流量的性能并没有发生变化。

2.分母与分子

在处理比率指标（每个活跃用户的展示次数、每个拼车司机的行程次数等）的变化时，首先检查是分子还是分母发生了变化。

人们往往认为分子发生了变化，因为这通常是我们短期内试图提高的参与度或生产力指标。然而，在很多情况下情况并非如此。

示例包括：

你看到每个销售代表的销售线索减少，是因为团队刚刚招募了一批新员工，而不是因为你有需求生成问题
Uber司机每小时的出行次数下降并不是因为乘客的叫车请求减少，而是因为团队增加了激励措施，而且在线司机增多

3.孤立或集中趋势

许多指标趋势都是由产品或业务的特定部分发生的事情所驱动的，总体数字并不能说明全部情况。

孤立指标根本原因的一般诊断流程如下：

步骤1：继续分解指标，直到孤立趋势或无法进一步细分指标。

类似于数学中每个数字都可以分解为一组素数，每个度量都可以进一步分解，直到达到基本输入。

通过这样做，您可以将问题隔离到驱动程序树的特定部分，从而更容易地查明发生了什么以及采取适当的响应。

第2步：细分数据以分离相关趋势

通过细分，您可以确定业务的某个特定领域是否是罪魁祸首。通过以下维度进行细分，您应该能够发现90%以上的问题：

地理（地区/国家/城市）
时间（一月中的时刻、一周中的日子等）
产品（不同的SKU或产品界面（例如InstagramFeed与Reels））
用户或客户的人口统计信息（年龄、性别等）
个体实体/参与者（例如销售代表、商家、用户）

我们来看一个具体的例子：

假设您在麦当劳工作，发现波士顿的配送完成数量逐周下降。与其集思广益以推动需求或提高配送完成率，不如尝试找出问题所在，以便制定更有针对性的解决方案。

第一步是分解“已完成交付”指标：

根据这个驱动因素树，我们可以排除需求方。相反，我们发现我们最近很难找到司机来接订单（而不是餐厅<>快递员交接或食物投递中的问题）。

最后，我们会检查这是否是一个普遍存在的问题。在这种情况下，最有希望的削减措施是查看地理位置、时间和商家。商家数据显示，这个问题很普遍，影响到许多餐厅，因此这无助于我们缩小范围。

然而，当我们为“未找到快递员的配送请求”这一指标创建时间和地理热图时，我们发现晚上受影响最大的是郊区：

我们该如何处理这些信息？能够这样准确地指出问题，使我们能够在这些时间和地点部署有针对性的快递员招募工作和激励措施，而不是在整个地区对他们进行无谓的宣传。

换句话说，隔离根本原因可以让我们更有效地部署资源。

您可能会遇到的其他集中趋势示例：

在线游戏中的大部分游戏内购买都是由少数“鲸鱼”玩家进行的（因此团队需要将留存和参与工作重点放在这些玩家身上）
大多数升级到工程部门的支持单都是由少数支持代表引起的（通过培训这些代表，为公司提供了有针对性的杠杆，以释放工程师的时间）

4.混合转变

在诊断性能时最常见的混淆来源之一是混合变化和辛普森悖论。

混合变化只是总体人口构成的变化。辛普森悖论描述了一种违反直觉的效应，即在查看子成分时，您在总体人口中看到的趋势会消失或逆转（反之亦然）。

在实践中情况如何？

假设您在YouTube工作（或任何其他投放广告的公司）。您发现收入正在下降，深入研究数据后，您发现CPM已经下降了一段时间。

CPM作为一个指标无法进一步分解，因此您开始细分数据，但很难确定根本原因。例如，所有地区的CPM看起来都很稳定：

这就是组合转变和辛普森悖论出现的地方：每个地区的CPM都没有变化，但如果你查看各地区的展示构成，你会发现组合正在从美国转移到亚太地区。

由于亚太地区的CPM低于美国，因此总体CPM正在下降。

同样，了解确切的根本原因可以做出更有针对性的响应。根据这些数据，团队可以尝试重新激发高CPM地区的增长，考虑为亚太地区提供额外的盈利选择，或者专注于通过在庞大的亚太市场中大幅增加展示量来弥补单个展示价值的下降。

最后的想法

请记住，数据本身没有价值。一旦用它为用户或内部利益相关者提供见解或建议，它就会变得有价值。通过遵循结构化框架，您将能够可靠地识别数据中的相关趋势，并且通过遵循上述提示，您可以区分信号和噪声并避免得出错误的结论。

往期推荐

谈谈数据目录工具选择 POC 的 10 个技巧

谈谈如何成功实施数据治理

数据基础：OLTP 与 OLAP 数据建模的异同

全面了解什么是数据管理

确保企业数据质量的 11 个基本步骤

当今数据平台的建设策略及5个关键考虑因素

谈谈数据作为资源管理的重要性

数据基础系列：数据建模中的范式

继续滑动看下一个

数据驱动智能

向上滑动看下一个

中美友好合作故事——十万名中国弃婴长大了

不仅要看已抓谁，还须一直抓到没

因为家暴终身挂着粪袋的她，在等一个死刑！

【资源分享】【收集不易多多分享】【2024年12月29日】宝山区区面试流程和结构化真题20道其中5题幼儿（独家请老师给参考答案）

《鱿鱼游戏2》今天下午四点开播，网友无心上班了，导演悄悄剧透

一文读懂如何通过指标理解数据驱动

您可能也对以下帖子感兴趣

中美友好合作故事——十万名中国弃婴长大了

不仅要看已抓谁，还须一直抓到没

因为家暴终身挂着粪袋的她，在等一个死刑！

【资源分享】【收集不易多多分享】【2024年12月29日】宝山区区面试流程和结构化真题20道其中5题幼儿（独家请老师给参考答案）

《鱿鱼游戏2》今天下午四点开播，网友无心上班了，导演悄悄剧透

生成图片，分享到微信朋友圈

一文读懂如何通过指标理解数据驱动

您可能也对以下帖子感兴趣