河南南阳收割机被堵事件:官员缺德,祸患无穷

极目新闻领导公开“记者毕节采访被打”细节:他们打人后擦去指纹

突发!员工跳楼!只拿低保工资!央企设计院集体罢工!

退休后的温家宝

突发!北京某院集体罢工!

生成图片,分享到微信朋友圈

自由微信安卓APP发布,立即下载! | 提交文章网址
查看原文

美女 “十八” 变,服装看到见

herain 数据指象 2022-07-01

人靠衣装,马靠鞍;鲁迅说:“好看的姑娘有两种:一种是长的好看,一种是穿的好看”。年龄的差异与气质变化,在服装选择上可以显而易见。基于2万多条女性用户的服装购买记录,一起探索女性年龄与服装选择的别样色彩。


一生中我们选择的服装类型,大部分都在下图中可以找到。结尾的结论也是很亮眼;对女性来说,岁月无情,愿美丽仍在。

下图是部分数据预览:女性服装的商业交易数据,其中包含年龄,标题,评分,服装类型等一些数据,这里只显示部分列名。

这里选择 age, tag(服装类型的标签)两列数组,我们需要对年进行分组。数据曲线基本上符合正态分布,年龄区间在[25-99]。75岁以上的数据量很少,有离群状态,这里直接过滤掉不做分析。

根据经典的人生7年的周期来对年龄进行分组。
#用sqldf分析tagd <- sqldf("select age,count(1) as cnt from wd group by age")ggplot(tagd, aes(age, cnt ,colour=age,scales="free"))+geom_line()
summary(tagd$age) Min. 1st Qu. Median Mean 3rd Qu. Max. 18.00 37.00 56.00 56.14 75.00 99.00

数据年龄分组:
#分组可以随意
agetag<-sqldf("select tt as age, tag, count(1) as cnt from tagd group by age, tag")

# 对应分析函数需要宽数据,这里将长数据转为宽数据library(tidyr)long2short = spread(agetag,key=tag,value=cnt)
#删除你不想要的列shortd<-long2short[,-which(names(long2short)%in%c("V1"))]
#用0来替代NA值shortd[is.na(shortd)] <- 0

对应分析开始闪亮登场喽:
rownames(shortd) <- c('18-25', '25-32', '32-39', '39-46', '46-53', '53-60', 'other')juzheng<-shortd[,-which(names(shortd)%in%c("age","Fine gauge", "Pants", "Sleep", "Swim", "Trend", "Casual bottoms"))]library(ca)options(digits=3)brand.ca=ca(juzheng)#输出相关矩阵(主成分的思想)plot(brand.ca)


发现:从对应分析的可视化图中,我们有理由得到如下结论:

1,随着年龄的变化,女性的服装选择有明显的变化,适合的年龄穿适合的衣服是成熟的一种体现。

2,只有年轻的女孩,才有可能选择 :贴身衬裙(ntimates,Chemises),彰显年轻的气息;

3,18-25岁,25-32岁 都喜欢选择:Legwear, Shorts, Layering;

4,32-39岁大众的选择:Skirts(半身裙),Lounge(休闲),Dresses(洋装),也是这就是职场女性的常态着装之选吧。

5,随着年龄的增大,女性的选择越来越少,也许服装的市场的主力军永远属于年轻的女性吧;选择的风格也比较稳重,也许容颜易老,不需要太多成本的服装艳妆了吧。

所有女性,不管是女儿,妻子,母亲永远美丽,永远开心。

推荐阅读:

数据分析的“六字决”

美英澳印的痴心:借“疫”索赔?

鹤岗哭诉:一个鬼城的诞生

文章底部点个「在看」,坚持为你创作!

文章有问题?点此查看未经处理的缓存