查看原文
其他

企业后台数据的“假”(之一)

刘德寰 刘德寰 2022-04-08

 

误区

我们经常看到企业发布大数据结果,将自己的后台数据计算出来,用于决策和公关,而且一旦发现任意其他机构发布的数据跟自己后台数据“不一致”时就会质疑第三方机构发布的数据。因为企业坚定的认为只有自己的后台数据才是“真”的,结论与我后台数据不一样的就“假”的。


事实是什么呢?可能颠覆你的认知,企业大数据运算的结果不是我们一般意义上看问题的方式,是“假”的,而外部分析的数据(如果数据抽样合理)的结论是“真”的。


怎么会这样?我给大家一个简单的例子就能理解了。



以知名的互联网视频W公司的数据为例(2018年移动互联网全景研究,样本量10000人)


如果从类后台数据角度看公司内部数据(俗称行百分百,行相加等于100%)时,城市级别的分布如下:

表1.W公司不同城市线级用户在该公司总用户人数中所占比例

(俗称行百分百,行相加等于100%)

从上表可以看出,公司用户随着城市级别越低,用户越多,公司的公关和市场部门会对外宣布:企业W用户结构下沉,覆盖中国广大的三四线城市。


但是我们换一个角度,数据还是那个数据,用户还是那些用户,只是看比例的方式变化一下,表格展现了另外一个图景(俗称列百分百,列相加等于100%)。

表2.W公司不同城市线级用户在该城市线级样本中所占比例

(俗称列百分百,列相加等于100%)

结论,W公司用户在各个级别的城市比例相差不大,而且城市级别越高,用户越多。


同样一个数据,会得出完全相反的结论。


如果说这个数据给企业和广告主带来的认知对营销影响不大的话,换一个变量是我们可以看到W公司被“后台数据”牵引带来了对真实用户结构的“盲区”,隐忧巨大。


还是W公司类后台数据(行百分百)现实的年龄结构是:


表3.W公司不同年龄段用户在该公司总用户人数中所占比例

(俗称行百分百,行相加等于100%)

W公司可以对广告主宣称:我们的用户年轻人占比高,30岁以下用户为54%以上,吸引了广大年轻用户,甚至可以宣称企业用户结构好,发展态势好之类。


但是,我们看看列百分比呢?完全另外的图景。


表4.W公司不同年龄段用户在该年龄段样本中所占比例

(俗称列百分百,列相加等于100%)

结论是:W公司市场细分不明,没有优势群体,用户年龄结构老化,发展面临严重问题。

 

千万别小看就是一个简单的行列百分比换算,维度错误,后患无穷。


假设我们将研究公认的看数据的方式(列百分比)公布出去,A公司会很“生气”,后果可想而知:数据作假、黑公关、不专业。因为企业已经在行百分百的虚幻中呆久了,以为“真数”就能带来“真结论”、“真认知”。


我想说的是:“真数据”,如果不配合以正确的分析,能够带来幻象般的“假结论”。分析永远强于数据,千万别被自己的后台百万、千万级的数据的表格“迷了眼”。

未完待续

♥推荐阅读:

市场研究业的变局

“西瓜足迹”的傻白甜

移动互联网购物的10个趋势判断



刘德寰

谈洞察、谈调查的学者

谈数据、谈营销的专家

谈天谈地谈人的凡人

微信号:liudehuanpku

 


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存