必看!信息流三大数据陷阱,你中招了吗?
“
首先介绍一个理论:辛普森悖论
当人们尝试探究两种变量(比如新生录取率与性别)是否具有相关性的时候,会分别对之进行分组研究。然而,在分组比较中都占优势的一方,在总评中有时反而是失势的一方。
该现象于20世纪初就有人讨论,但一直到1951年,E.H.辛普森在他发表的论文中阐述此一现象后,该现象才算正式被描述解释。后来就以他的名字命名此悖论,即辛普森悖论。
01
你的素材转化率真的低吗?
带入广告的角度,如下面案例:
定向1 | 定向2 | |||||
转化 | 曝光 | 转化率 | 转化 | 曝光 | 转化率 | |
红包提现 | 49 | 100 | 49% | 15 | 20 | 75% |
抽手机 | 1 | 20 | 5% | 10 | 100 | 10% |
总计 | 50 | 120 | 42% | 25 | 120 | 21% |
大家第一眼看哪个定向更好?
数据单独拆分看,定向2红包提现的素材转化率75%,比定向1的49%高;抽手机的素材转化率10%,也比定向1的5%高。
那是不是说明定向2比定向1更好呢?
可是数据聚合看看,定向1整体的转化率42%比定向2的21%高了很多!
这就是辛普森悖论!在数据分析中,两个变量的交叉使用时,难免会遇到上述的情况。
定向得配合素材一起测试,才能得出结论。那要怎么去分析才合理呢?
在我们日常观测数据时,不要简单将数据进行汇总求百分比,此时容易出现这个误区,可以将不同纬度的分母换算成相同的数值,例如【定向1】【抽手机】数据换成转化5,曝光100,转化率依然为5%,【定向2】【红包提现】转换成转化75,曝光100,转化率依然不变,此刻再进行求和计算,找到真正转化率高的定向与素材。分母换算成同样的数值后,明显定向2的转化还是优于定向1。定向1 | 定向2 | |||||
转化 | 曝光 | 转化率 | 转化 | 曝光 | 转化率 | |
红包提现 | 49 | 100 | 49% | 75 | 100 | 75% |
抽手机 | 5 | 100 | 5% | 10 | 100 | 10% |
总计 | 54 | 200 | 27% | 85 | 200 | 42% |
02
成本变高,我压低出价有用吗?
遇到成本飘高,很多优化师第一反应是控预算、压出价,这不一定是最有效的解决方式,但是能给优化师心理上的“安全感”:我都压价了,成本应该能下来吧!
那我们怎样从数据分析的角度来看看压价到底有没有用?
假设:现在成本高,我通过压低出价,从而降低整体成本。
假设条件:几个基本假设我们中,假设广告主质量度是一致的,排名越高即越贵,转化率越高;排名越低越便宜,转化率越低(不然我们追求排名干什么)
假设环境:竞争环境处于绝对理想竞争环境,也就是每天你都可以拿到3000个展现,并且排名有3个,竞争对手也只有3个。每天都展现都可以被广告主完全覆盖。
某个关键词排名1.2.3各有展现1000次,分别点击率10%,8%,6%,转化率分别是7%,3%,1%,对应的点击价格为3,2,1。相关数据如下
此刻认为成本过高,想通过降低出价从而进行降低成本
假设现在成本高,我想通过调整出价来降低成本,那么会出现以下情况:
1、整体展现变少,成本不变,消耗掉了。
因为对应排名给到的出价降低,及第一名展现1000次的变为500次,第二名展现1000次的变为500次,第三名展现1000次的变为500次,假设都是线性降低,整体成本是不会有变化(最理想的情况,这种情况不过多讨论,意义不大)
2、消耗没掉,成本反涨。
通过降低出价后,整体展现次数不变,但是排名发生了位移,例如第一名展现1000次向第二名转移,第二名的原本的展现向着第三名转移,整体展现次数不变。
如图所示
通过这次假设降价的操作可以参考,成本并没有降低,反而提高了,为何发生这类现象,和进一步的拆解,后续再论(并不是转化率降低了这么简单)。
3、消耗没掉,成本也降下来了。
这是大家预期中的结果,什么情况下能达到预期结果呢?这里就涉及到一个转化率的区别,也就是“高价人群性价比”。例如我们初始的转化率梯度为1.5%、1.3%、1%,那么降价之后如下图,成本是降了的,并且整体展现不变,只是由高排名往下迁移。
4、通过调整出价,无任何影响(或者说影响范围不大)
在提出这个假设之前,先说一个排名计算公式:点击价格=(下一名出价*下一名关键词质量度)/你的质量度+0.01。
这里大家仔细看清楚,值得的是下一名的出价
质量度都是1
第三名出价3,质量度1,cpc3元
第二名出价4,质量度1,cpc3.1元
第一名出价10,质量度1,cpc是4.1元,
那么在这种情况下,你降低出价由5降低至4.5,其实cpc依然没有变化,展现也依然没有变化。自然成本也会无变化。
根据媒体的公式,你的出价只是你能承受的上限,
但是实际操作中可以发现,我们每次降低出价后,整体账户还是有变动,因为每次曝光请求都是独立的,即使你使用同样的出价,不做任何操作,质量度在变化,竞争对手的出价也在变化,不可能有如此理想的数据状态。
想表达的是,在推广优化中,并不是单一维度能达到我们的目的,请更加全面的考虑。
5、什么都不做,成本涨了
还是先看案例3中的点击价格计算公式。我们依然进行假设
此刻我们并没有做任何操作,但是竞争对手在第二名的出价提升至9元,实际上竞争对手的cpc依然是3.1元,但是第一名因为受到第二名的顶价,cpc直接上升至9.1元,此刻大家排名依然不变,第一名会产生极大的广告费用浪费。第二名与第三名成本与效果不变。这也是我们常说的流量波动,但是此刻的外部流量无任何波动,波动来自同行。
6、调高出价,去拿更多排名更好的流量,从而降低成本有可能吗?
继续看图
看起来好像有作用了,比最开始的52成本,降低了很多,但是我们的转化率是假设的,如果分布情况差距没这么大呢,例如下图(转化率性价比,整体排名分布的更加合理,参照数据,平台披露的平均线数据CTR 展现,自身排名 转化率,)
平均排名不变,cpc也不变,展现也不变,点击次数也不变,点击率不变,但是成本差距两倍多。因为第一名的转化率价值更低了,你去花更多的钱,买了一个平均展现价值更低的流量(关于怎么计算平均展现价值,后续在讨论)
请留意数据陷阱,不要朴素的对数据进行高低判断。
所以我们可以得出结论,提价和降价并不能一定达到预期,主要因素还是“平均展现价值”,也就是我们口中的人群性价比,和转化率相关联,如果能计算出大概的性价比,就能知道我的计划压价/提价有没有效果(理想情况)。
03
怎么样统计数据才算有效果?
我操作了一个动作,点击率提升10倍,这是有效果吗?
日常投放过程中,原始数据为展现100,点击1,点击率1%,经过优化后,展现100,点击4,点击率4%,提升了4倍点击率,明显这个因为数据量太少,不具备说服力
那优化后,展现10万,点击4千,点击率4%,这次可以说有效果了,那这个临界值在哪里?
那就需要用到显著性的理论,通过计算得出更科学的判断,并且根据这个可以判断样本量需要积累到多些数据才具备说服力。
掌握好数据分析,对于效果的优化是很有帮助的。有兴趣的朋友可以进一步探讨。
一个月内直播间GMV从5w涨到70w,这45张截图把关键的细节都透露给你了!
听说点 “在看” 会起量