查看原文
其他

必看!信息流三大数据陷阱,你中招了吗?

兆辉 三里屯信息流 2022-06-24


首先介绍一个理论:辛普森悖论

当人们尝试探究两种变量(比如新生录取率与性别)是否具有相关性的时候,会分别对之进行分组研究。然而,在分组比较中都占优势的一方,在总评中有时反而是失势的一方。

该现象于20世纪初就有人讨论,但一直到1951年,E.H.辛普森在他发表的论文中阐述此一现象后,该现象才算正式被描述解释。后来就以他的名字命名此悖论,即辛普森悖论。


01

你的素材转化率真的低吗?

带入广告的角度,如下面案例:


定向1

定向2


转化

曝光

转化率

转化

曝光

转化率

红包提现

49

100

49%

15

20

75%

抽手机

1

20

5%

10

100

10%

总计

50

120

42%

25

120

21%

大家第一眼看哪个定向更好?

数据单独拆分看,定向2红包提现的素材转化率75%,比定向1的49%高;抽手机的素材转化率10%,也比定向1的5%高。

那是不是说明定向2比定向1更好呢?

可是数据聚合看看,定向1整体的转化率42%比定向2的21%高了很多!

这就是辛普森悖论!在数据分析中,两个变量的交叉使用时,难免会遇到上述的情况。

定向得配合素材一起测试,才能得出结论。那要怎么去分析才合理呢?

在我们日常观测数据时,不要简单将数据进行汇总求百分比,此时容易出现这个误区,可以将不同纬度的分母换算成相同的数值,例如【定向1】【抽手机】数据换成转化5,曝光100,转化率依然为5%,【定向2】【红包提现】转换成转化75,曝光100,转化率依然不变,此刻再进行求和计算,找到真正转化率高的定向与素材。分母换算成同样的数值后,明显定向2的转化还是优于定向1。

定向1

定向2


转化

曝光

转化率

转化

曝光

转化率

红包提现

49

100

49%

75

100

75%

抽手机

5

100

5%

10

100

10%

总计

54

200

27%

85

200

42%

 


02

成本变高,我压低出价有用吗?

遇到成本飘高,很多优化师第一反应是控预算、压出价,这不一定是最有效的解决方式,但是能给优化师心理上的“安全感”:我都压价了,成本应该能下来吧!

那我们怎样从数据分析的角度来看看压价到底有没有用?

假设:现在成本高,我通过压低出价,从而降低整体成本。

假设条件:几个基本假设我们中,假设广告主质量度是一致的,排名越高即越贵,转化率越高;排名越低越便宜,转化率越低(不然我们追求排名干什么)

假设环境:竞争环境处于绝对理想竞争环境,也就是每天你都可以拿到3000个展现,并且排名有3个,竞争对手也只有3个。每天都展现都可以被广告主完全覆盖。

某个关键词排名1.2.3各有展现1000次,分别点击率10%,8%,6%,转化率分别是7%,3%,1%,对应的点击价格为3,2,1。相关数据如下

此刻认为成本过高,想通过降低出价从而进行降低成本

假设现在成本高,我想通过调整出价来降低成本,那么会出现以下情况:

1、整体展现变少,成本不变,消耗掉了。

因为对应排名给到的出价降低,及第一名展现1000次的变为500次,第二名展现1000次的变为500次,第三名展现1000次的变为500次,假设都是线性降低,整体成本是不会有变化(最理想的情况,这种情况不过多讨论,意义不大)

2、消耗没掉,成本反涨。

通过降低出价后,整体展现次数不变,但是排名发生了位移,例如第一名展现1000次向第二名转移,第二名的原本的展现向着第三名转移,整体展现次数不变。

如图所示

通过这次假设降价的操作可以参考,成本并没有降低,反而提高了,为何发生这类现象,和进一步的拆解,后续再论(并不是转化率降低了这么简单)。

3、消耗没掉,成本也降下来了。

这是大家预期中的结果,什么情况下能达到预期结果呢?这里就涉及到一个转化率的区别,也就是“高价人群性价比”。例如我们初始的转化率梯度为1.5%、1.3%、1%,那么降价之后如下图,成本是降了的,并且整体展现不变,只是由高排名往下迁移。

4、通过调整出价,无任何影响(或者说影响范围不大)

在提出这个假设之前,先说一个排名计算公式:点击价格=(下一名出价*下一名关键词质量度)/你的质量度+0.01。

这里大家仔细看清楚,值得的是下一名的出价

质量度都是1

第三名出价3,质量度1,cpc3元

第二名出价4,质量度1,cpc3.1元

第一名出价10,质量度1,cpc是4.1元,

那么在这种情况下,你降低出价由5降低至4.5,其实cpc依然没有变化,展现也依然没有变化。自然成本也会无变化。

根据媒体的公式,你的出价只是你能承受的上限,

但是实际操作中可以发现,我们每次降低出价后,整体账户还是有变动,因为每次曝光请求都是独立的,即使你使用同样的出价,不做任何操作,质量度在变化,竞争对手的出价也在变化,不可能有如此理想的数据状态。

想表达的是,在推广优化中,并不是单一维度能达到我们的目的,请更加全面的考虑。

5、什么都不做,成本涨了

还是先看案例3中的点击价格计算公式。我们依然进行假设

此刻我们并没有做任何操作,但是竞争对手在第二名的出价提升至9元,实际上竞争对手的cpc依然是3.1元,但是第一名因为受到第二名的顶价,cpc直接上升至9.1元,此刻大家排名依然不变,第一名会产生极大的广告费用浪费。第二名与第三名成本与效果不变。这也是我们常说的流量波动,但是此刻的外部流量无任何波动,波动来自同行。

6、调高出价,去拿更多排名更好的流量,从而降低成本有可能吗?

继续看图

看起来好像有作用了,比最开始的52成本,降低了很多,但是我们的转化率是假设的,如果分布情况差距没这么大呢,例如下图(转化率性价比,整体排名分布的更加合理,参照数据,平台披露的平均线数据CTR  展现,自身排名 转化率,)

平均排名不变,cpc也不变,展现也不变,点击次数也不变,点击率不变,但是成本差距两倍多。因为第一名的转化率价值更低了,你去花更多的钱,买了一个平均展现价值更低的流量(关于怎么计算平均展现价值,后续在讨论)

请留意数据陷阱,不要朴素的对数据进行高低判断。

所以我们可以得出结论,提价和降价并不能一定达到预期,主要因素还是“平均展现价值”,也就是我们口中的人群性价比,和转化率相关联,如果能计算出大概的性价比,就能知道我的计划压价/提价有没有效果(理想情况)。


03

怎么样统计数据才算有效果?

我操作了一个动作,点击率提升10倍,这是有效果吗?

日常投放过程中,原始数据为展现100,点击1,点击率1%,经过优化后,展现100,点击4,点击率4%,提升了4倍点击率,明显这个因为数据量太少,不具备说服力

那优化后,展现10万,点击4千,点击率4%,这次可以说有效果了,那这个临界值在哪里?

那就需要用到显著性的理论,通过计算得出更科学的判断,并且根据这个可以判断样本量需要积累到多些数据才具备说服力。

掌握好数据分析,对于效果的优化是很有帮助的。有兴趣的朋友可以进一步探讨。

往期推荐

朋友圈传疯了!终于有一首歌唱出了投放的辛酸!

发行首月流水过亿,万达院线游戏CEO亲自教你怎么起量!

一个月内直播间GMV从5w涨到70w,这45张截图把关键的细节都透露给你了!

点击关注

听说点 “在看” 起量

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存