数据分析36计(11):如何用贝叶斯概率准确提供业务方营销转化率
前言
以后的数据分析36计专辑文章都设为付费阅读,将数据分析方法沉淀为我们的行业优势,欢迎提出好的意见或好文章投稿。
点击上面查看该专辑往期文章👆👆👆
1. 背景
2. 使用贝叶斯概率来量化不确定性
数据
生成模型
先验概率
数据
本案例中的数据将来自我们进行的初步研究。我们知道,在向这本小册子展示的23家德克萨斯人中,有9家被转化为客户。
先验是模型在看到任何数据之前所拥有的信息。用贝叶斯术语来说,先验是一种概率分布,用于表示模型中的不确定性。这里的先验概率分布为转化率的概率分布。这里无法得知转化率这一先验分布具体是哪一种分布(主观先验),可以采用无信息先验分布来进行计算。没有转化率的任何信息即为:将转化率取值范围上的均匀分布作为转化率的先验分布。通过使用[0,1]的均匀概率分布,表示在看到任何数据之前,该分布假设0和1之间(0%到100%)之间的任何转化率的概率都是相等的。
拟合模型
# number of samples to draw from the prior distributionn_size <- 100000# drawing sample from the prior distribution - which in our case is uniform distributionprior_dist <- runif(n_size, 0, 1)# peeking at the histogram to verify the random sample was generated correctly.hist(prior_dist, main = "Histogram of Prior Distribution", xlab = "Prior on the Conversion Rate", ylab = "Frequency")微信扫一扫付费阅读本文
可试读28%
微信扫一扫付费阅读本文