“双十一”坑人套路大揭秘——购物篮分析
编者按
又是一年一度的“双十一”,好好的单身节硬是被阿里巴巴变成了全民购物狂欢节。经过十年的双十一,我们已经看到数据在其中发挥了至关重要的作用。双十一每年的成交额都在快速增长,今年显然也不例外。数据的增长一方面是经济发展,物质需求增加,但还有一方面是大数据的套路在其中也起了至关重要的作用。
1、现在每个人的双十一活动都是不同的;
2、你的账户页面下都是你买过的,或者潜在会买的东西;
3、针对每个用户提供不同的优惠活动,比如喜欢使用优惠券的,就多发优惠券,喜欢 满减的就多提供类似活动;
4、根据数据预测结果提前备货,就等你下单了;
5、大数据的好处是提供个性化的方案,提升每个人的购物体验,拉动内需,促进经济发展;
6、说的难听点,就是想方设法让你多花钱,多买东西。
利用R做购物篮分析
那么数据分析是如何做到这些的呢,下面我们就用一个最简单的案例来揭露一下这个套路。利用R语言进行购物篮分析。购物篮分析主要是通过交易账单,寻找商品之间内在的关联,比如经典的啤酒与尿不湿的故事。
案例代码
# 案例九:购物篮分析
install.packages("arules")
library(arules)
data(Groceries)
Groceries
inspect(Groceries)
fit <- apriori(Groceries,parameter = list(support=0.01,confidence=0.5))
summary(fit)
inspect(fit)
案例介绍
这个案例来自一家便利店9835个购物清单,里面主要是一些快消食品等,通过对这些数据分析,找出顾客购买商品之间的联系,例如购买了全脂牛奶的人是否还同时购买了酸奶等。
> Groceries
transactions in sparse format with
9835 transactions (rows) and
169 items (columns)
结果解析
通过对这些清单进行数据分析,最终发现15条规律。例如第一条,购买了奶酪酸奶的人,同时也购买全脂牛奶的概率比较大。
> inspect(fit)
lhs rhs support confidence lift count
[ ] {curd,yogurt} => {whole milk} 0.01006609 0.5823529 2.279125 99
[ ] {other vegetables,butter} => {whole milk} 0.01148958 0.5736041 2.244885 113
[ ] {other vegetables,domestic eggs} => {whole milk} 0.01230300 0.5525114 2.162336 121
[ ] {yogurt,whipped/sour cream} => {whole milk} 0.01087951 0.5245098 2.052747 107
[ ] {other vegetables,whipped/sour cream} => {whole milk} 0.01464159 0.5070423 1.984385 144
[ ] {pip fruit,other vegetables} => {whole milk} 0.01352313 0.5175097 2.025351 133
[ ] {citrus fruit,root vegetables} => {other vegetables} 0.01037112 0.5862069 3.029608 102
[ ] {tropical fruit,root vegetables} => {other vegetables} 0.01230300 0.5845411 3.020999 121
[ ] {tropical fruit,root vegetables} => {whole milk} 0.01199797 0.5700483 2.230969 118
[ ] {tropical fruit,yogurt} => {whole milk} 0.01514997 0.5173611 2.024770 149
[ ] {root vegetables,yogurt} => {other vegetables} 0.01291307 0.5000000 2.584078 127
[ ] {root vegetables,yogurt} => {whole milk} 0.01453991 0.5629921 2.203354 143
[ ] {root vegetables,rolls/buns} => {other vegetables} 0.01220132 0.5020921 2.594890 120
[ ] {root vegetables,rolls/buns} => {whole milk} 0.01270971 0.5230126 2.046888 125
[ ] {other vegetables,yogurt} => {whole milk} 0.02226741 0.5128806 2.007235 219
购物篮分析的应用
以上就是一个简单的购物篮分析的案例,实际应用中要比这个模型更加复杂,但是原理和目标是一致的。购物篮分析有着广泛的应用,例如可以用于商品推荐系统,常见的就是在购物页面会提示,买了唐诗的人也购买了宋词,买了宋词的人也购买了元曲。后面会继续推荐中国传统文化相关的书籍。包括今日头条的新闻内容推荐,快手抖音的视频推荐等等。
可怕的大数据
随着各种交易行为数据的数字化,大数据已经深刻影响着大家的购物习惯,在未来,机器比你自己都更加了解你,例如你将一个商品加入购物车,这一个简单的行为,后续会引发一系列连锁反应:
1、在你所有互联网浏览的时候,都会给你推荐同款或者类似的商品;
2、如果你加入购物车几天都没有购买,就会为你定制降价策略;
3、如果你加入之后更长时间都没有买,在为你定制专属优惠券;
4、针对一些快消品,例如牙膏,洗衣粉等,系统会在估算你快使用完之前的时候,给你定制新的促销活动;
……
认清套路不迷路
以上就是关于购物篮案例的一个介绍,其实大家也不用太担心,科学技术是一把双刃剑,换一种思路,越来越智能的购物推荐系统,会帮助每个人快速筛选到优质的商品,改善购物体验,提升生活品质,这本身是一件非常好的事情。消费不仅能够促进经济发展,让所有人受益,同时,购物本身也是一件愉快的事情,尤其是抢到半价便宜货。你需要做的事情不是少买东西,而是多努力赚钱。最后,祝大家双十一购物愉快,抢到物美价廉的商品,千万别学我,认清所有套路,就只能过单身节了……