企业后台数据的“假”(之二)
第一篇小文发出后,圈里有不少不太熟悉数据分析的朋友希望给出一个日常生活的故事,能够更好地理解行列百分比,也特别想理解其背后的意义,想了想,举个例子吧。
假设你从来没有看到过新生儿,突然有一天有个机缘见到一个刚刚出生的小孩,人们经常的反应是:
“哇,孩子好小,头真大,小腿、小胳膊,太好玩了!”
这个评价中包含了几个意思:
★
“孩子好小”
因为你平时见的大人多,小孩子也都是地上跑的,或者躺在车里晒太阳的,这么小的小孩都不出门;
“头真大”
因为你平时看到的大人和孩子,头所占的比例是你判断这个孩子的标准,同理,“小腿、小胳膊”;
“太好玩了!”
因为不常见,所以有兴趣。
因此,你判断这个孩子是基于这个孩子身材比例的特点与你日常生活见到的人比较而来,因为与日常有不同,所以你得出这个孩子很“独特”的看法。这就是行百分比的意义(基于你所见的个体<单个企业>与你日常生活的认知的比较)。
但是,同样是看到了这个孩子,还是头大、小腿、小胳膊,但是与此同时,你还见到了几十个刚刚出生的小孩(比如在医院产房),发现几乎所有的小孩都是头大、小腿、小胳膊,你的判断是什么?不是这个孩子“独特”,而是这个孩子跟其他孩子一样,得出的结论是,这个孩子很“正常”。这就是列百分比的意义(跟类似个体的比较)。
哪个是对的,都对?看怎么定义。如果从人生角度去看,“这个孩子很正常”是对的,“这个孩子很独特”是错的。
举个数据的例子。
同样来自于我主持的2018年移动互联网全景研究,样本量10000人。
下表中,A、B、C公司都是大家耳熟能详的视频网站(抱歉,因为担心对所涉及的企业有影响,隐去公司名称,但是数据是没有经过任意调整的真实结果),由于现在营销界对大数据的依赖,经常看到各个企业发布会上的数据均来自企业内部数据(行百分比),假设三家公司同时都选用内部数据的逻辑,将真实结果发布出来,我们将之整理成表格,如下:
表1.A\B\C三公司不同年龄段用户在该公司总用户中所占比例
(即:行百分比)
以现在的通常认知,公司都希望告诉广告主年轻人所占比例高,大家说30岁以下在平台所占比例,A公司82.4%,B公司54.8%,C公司54.7%,无疑广告主会认为如果自己的产品主打年轻人时,应该首选A公司,B公司和C公司差异不大。
但是同源数据,表格还是那个表格,只是行列百分比调整,再看数据结果,所有人都会对结论的变化感到震惊。如下为列百分比的结果。
表2.A\B\C三公司不同年龄段用户在该年龄段总样本中所占比例
(即:列百分比)
广告主还是想主打年轻人市场,这个结果出来后,几乎不言而喻,B公司无论在年轻人中的哪个段,拥有的用户数都远远高于其他两个公司,C公司其次,A公司相对覆盖率最低。如果不辅以其他数据分析,人们会毫不犹豫地给出B、C、A的顺序。
总结一下,企业内部数据分析只是看到内部拥有的结构,没有市场对比,得出结论的市场意义非常弱,这也是为什么所谓企业内部大数据分析遭遇瓶颈的根本原因。
顺带说一句,如果只会整理数据、展示数据,而没有正确的分析,企业负责人在这样的数据上进行决策,风险是非常高的。
现在的一种思潮是企业自己分析数据,雇佣很多学计算机和算法的人才,以此为决策的依据,这相较于“拍脑袋”已经是一个进步,但是“术业专攻”,真正的市场分析还是应该交给专业的人去做,企业自身只看自己是很难得出有营销意义的决策的,更多的是将行百分比(在市场判断是不是真)的结果用于公关,说实话:可惜了,也浪费钱了。
我一直喜欢好友王煜全的那句话:
“专业的人做专业的事儿!”
未完待续♥推荐阅读:
刘德寰
谈洞察、谈调查的学者
谈数据、谈营销的专家
谈天谈地谈人的凡人
♥
微信号:liudehuanpku