企业后台数据的“假”(之一)
误区
我们经常看到企业发布大数据结果,将自己的后台数据计算出来,用于决策和公关,而且一旦发现任意其他机构发布的数据跟自己后台数据“不一致”时就会质疑第三方机构发布的数据。因为企业坚定的认为只有自己的后台数据才是“真”的,结论与我后台数据不一样的就“假”的。
事实是什么呢?可能颠覆你的认知,企业大数据运算的结果不是我们一般意义上看问题的方式,是“假”的,而外部分析的数据(如果数据抽样合理)的结论是“真”的。
怎么会这样?我给大家一个简单的例子就能理解了。
以知名的互联网视频W公司的数据为例(2018年移动互联网全景研究,样本量10000人)
如果从类后台数据角度看公司内部数据(俗称行百分百,行相加等于100%)时,城市级别的分布如下:
表1.W公司不同城市线级用户在该公司总用户人数中所占比例
(俗称行百分百,行相加等于100%)
从上表可以看出,公司用户随着城市级别越低,用户越多,公司的公关和市场部门会对外宣布:企业W用户结构下沉,覆盖中国广大的三四线城市。
但是我们换一个角度,数据还是那个数据,用户还是那些用户,只是看比例的方式变化一下,表格展现了另外一个图景(俗称列百分百,列相加等于100%)。
表2.W公司不同城市线级用户在该城市线级样本中所占比例
(俗称列百分百,列相加等于100%)
结论,W公司用户在各个级别的城市比例相差不大,而且城市级别越高,用户越多。
同样一个数据,会得出完全相反的结论。
如果说这个数据给企业和广告主带来的认知对营销影响不大的话,换一个变量是我们可以看到W公司被“后台数据”牵引带来了对真实用户结构的“盲区”,隐忧巨大。
还是W公司类后台数据(行百分百)现实的年龄结构是:
表3.W公司不同年龄段用户在该公司总用户人数中所占比例
(俗称行百分百,行相加等于100%)
W公司可以对广告主宣称:我们的用户年轻人占比高,30岁以下用户为54%以上,吸引了广大年轻用户,甚至可以宣称企业用户结构好,发展态势好之类。
但是,我们看看列百分比呢?完全另外的图景。
表4.W公司不同年龄段用户在该年龄段样本中所占比例
(俗称列百分百,列相加等于100%)
结论是:W公司市场细分不明,没有优势群体,用户年龄结构老化,发展面临严重问题。
千万别小看就是一个简单的行列百分比换算,维度错误,后患无穷。
假设我们将研究公认的看数据的方式(列百分比)公布出去,A公司会很“生气”,后果可想而知:数据作假、黑公关、不专业。因为企业已经在行百分百的虚幻中呆久了,以为“真数”就能带来“真结论”、“真认知”。
我想说的是:“真数据”,如果不配合以正确的分析,能够带来幻象般的“假结论”。分析永远强于数据,千万别被自己的后台百万、千万级的数据的表格“迷了眼”。
未完待续♥推荐阅读:
刘德寰
谈洞察、谈调查的学者
谈数据、谈营销的专家
谈天谈地谈人的凡人
♥
微信号:liudehuanpku