突发!员工跳楼!只拿低保工资!央企设计院集体罢工!

突发!北京某院集体罢工!

淄博向东,惠泊向西:在人民与人民币之间,惠泊停车选择了人民币

【少儿禁】马建《亮出你的舌苔或空空荡荡》

10部适合女性看的唯美情色电影

生成图片,分享到微信朋友圈

自由微信安卓APP发布,立即下载! | 提交文章网址
查看原文

数据分析36计(11):如何用贝叶斯概率准确提供业务方营销转化率

夏芷 DataGo数据狗 2022-07-01
前言
以后的数据分析36计专辑文章都设为付费阅读,将数据分析方法沉淀为我们的行业优势,欢迎提出好的意见或好文章投稿。

点击上面查看该专辑往期文章👆👆👆

1. 背景

seeder是一家在加利福尼亚州销售电动踏板车的公司,他们正试图通过在德克萨斯州开拓新市场,seeder的营销团队利用印刷媒体,并设计了一本小册子以吸引新客户,他们将小册子分发给23个人,最终完成9笔订单。
seeder管理层想知道是,印刷媒体在推销新的电动滑板车方面有多好?如果公司继续制作大量小册子,能预计有多少的转化率?首先,一般的商业分析师会想到用频率学派中的频率代表概率的方法,转化率等于订单数除以分发的总数为9/23=39%。
但是这里的小样本不适用于上面的计算,通过贝叶斯方法计算概率能更好的得出准确描述业务状态的结果。

2. 使用贝叶斯概率来量化不确定性

为了能量化业务中转化率的不确定性,我们需要解决三件事:
  • 数据

  • 生成模型

  • 先验概率

数据

本案例中的数据将来自我们进行的初步研究。我们知道,在向这本小册子展示的23家德克萨斯人中,有9家被转化为客户。

生成模型
生成模型传递某些参数,例如转化率,以便该模型基于该参数模拟业务数据。例如,我们可以假设转化率为40%,然后向随机选择的50个德克萨斯州人展示手册。根据我们假定的转化率,生成模型将估算出将要进行的20笔销售。现在基于假设的生成模型,已知业务数据,反向求解生成模型,以便得到转化率。为了实现这一点,我们需要先确定先验概率。
先验概率

先验是模型在看到任何数据之前所拥有的信息。用贝叶斯术语来说,先验是一种概率分布,用于表示模型中的不确定性。这里的先验概率分布为转化率的概率分布。这里无法得知转化率这一先验分布具体是哪一种分布(主观先验),可以采用无信息先验分布来进行计算。没有转化率的任何信息即为:将转化率取值范围上的均匀分布作为转化率的先验分布。通过使用[0,1]的均匀概率分布,表示在看到任何数据之前,该分布假设0和1之间(0%到100%)之间的任何转化率的概率都是相等的。

拟合模型

用先验分布为参数值模拟随机样本。在本例中,参数值是转化率。R语言如下:
# number of samples to draw from the prior distributionn_size <- 100000# drawing sample from the prior distribution - which in our case is uniform distributionprior_dist <- runif(n_size, 0, 1)# peeking at the histogram to verify the random sample was generated correctly.hist(prior_dist, main = "Histogram of Prior Distribution", xlab = "Prior on the Conversion Rate", ylab = "Frequency")

微信扫一扫付费阅读本文

可试读28%

微信扫一扫付费阅读本文

文章有问题?点此查看未经处理的缓存