查看原文
其他

大数据告诉你旅行青蛙饲养员的秘密

二胖 大数据前沿 2019-02-24


⬆️蛙蛙等你点蓝字“二胖并不胖”关注公众号


旅かえる


最近我们的朋友圈被一只小青蛙🐸刷屏了

二胖在养蛙的同时也很好奇

这只小青蛙究竟吸引了哪些“蛙爸蛙妈”争先饲养呢

本次抽样统计,二胖在微博上搜集了15000个蛙爸蛙妈的个人信息和25000条相关微博的评论。挖掘了蛙爸和娃妈们的性别、所在地省份和城市、学校、公司、手机品牌等信息,同时对蛙爸蛙妈的微博昵称和评论进行了关键词提取。



饲养员的性别

数据表明,蛙蛙饲养员多为可爱的小姐姐,比例高达85%。

Girls心底的柔软都体现在对蛙儿子的牵挂中,遍布朋友圈的“寻蛙启事”充分说明了“蛙行千里母担忧”。小姐姐们蛙蛙的名字也大多比较“温柔”?比如“长大的种子”、“大姨妈的春天”、“李泽言和我的儿子”。

在广大蛙妈妈的包围中,还有一小部分蛙爸爸,占比约15%。他们多是热爱生活和萌宠的小哥哥“出可称霸吃鸡战场,入可喂胖旅行青蛙”说的应该就是他们吧!汉子们的蛙蛙名字也有些粗犷,如“扣尼基蛙”、“弹射小钢炮”、“原谅蛙”。

还有那只“不是单身蛙”,请放开那个女孩,当心“女蛙造人(wa)”。


饲养员的昵称

数据表明,蛙蛙饲养员的微博昵称中,包含“一只”、“可爱”、“少女心”、“萌”等词语的数量较多。

“一只”的出现频率最高,根据二胖在微博的深入探索,发现这类用户基本都是女孩子,是不是可爱的小姐姐比较喜欢用“只”来形容自己,把自己当成小动物嘞?

“少女心”的出现让二胖有些意外,原本以为“老母亲”这个词要出现的更为频繁,毕竟蛙妈妈们都以自己“养天养地养青蛙”的老母亲形象自居,看来各位妹子的潜意识还是非常的“少女心”。



饲养员的学校


数据表明,蛙蛙饲养员们的知识文化水平较高

北京大学的学霸们在繁重的课业生活外积极养蛙,他们心中对蛙蛙溢出的爱已经肉眼可见。山东大学也不示弱,其蛙蛙饲养员的数量和北大大致相当。

苏州大学、天津师范大学、厦门大学紧随其后,而这些排名靠前的学校,有一个共同的特征,就是妹子数量相对较多。果然,小姐姐们的力量无限。

可能蛙蛙的生活就是我们潜意识中的梦想吧!

吃饭旅行到处走走停停&有房有地&有房有地&有房有地(重要的事情说三遍)



饲养员的手机

数据表明,饲养员使用的手机数量排名前十的是:iphone、oppo、vivo、华为、荣耀、小米、魅蓝、乱入的iPad、三星、魅族。

使用苹果手机的用户更爱养蛙,在我们的统计样本中,占比约45%。手机其实就是蛙蛙们的房子,看来养个孩子还是蛮贵的,是不是用iPhone养的蛙蛙更圆润呢?

在使用安卓手机的饲养员中,使用oppo和vivo的人数最多。而妹子作为这两款手机的主要面向群体,为o+v的上榜贡献了最大力量。

其实我们应该像蛙蛙学习,多看看书、做做手工、出去旅旅行,不要再想“李泽言和我的儿子”了好么。


饲养员的省份

数据表明,广东人最爱养蛙。

基于广东庞大的人口基数和较高的GDP,可以理解旅行青蛙在这里的流行。来自海外的用户也贡献了相当部分的份额,不过这些用户中的大多数还是我们中华儿女🐸。北京在此排名中屈居第三,首都人民居然“不吃烤鸭养青蛙”?

在大城市打拼的饲养员们,请想想自己蛙儿子的房和地是在北京,妥妥的母/父(bai)凭(ri)子(zuo)贵(meng)啊有木有!


饲养员的城市

数据表明,北京、上海、成都三所城市的蛙蛙饲养员最多。

如果按行政单位划分,北京和上海是是省级行政单位。这样,按市级行政单位排名,第一位就是成都,想想每次去成都和重庆都要吃“干锅牛蛙”、“爆炒牛蛙”、“跳水蛙”,想想都可怕。

成都人民,你们看见二胖的蛙了吗?已经3天没回家了。



饲养员的公司


数据表明,个体户养蛙相对较多。

最令二胖惊讶的是“张艺兴工作室”,看来张艺兴小绵羊和其工作室的工作人员都很有爱哦!

在排名靠前公司中,国企的数量较多,可能与其相对小的工作压力和相对少的工作时间有关。



饲养员的微博评论

数据表明,在相关话题和微博的评论下,“允悲”、“回来”、“哈哈”、“可爱”、“儿子”、“出去”、“旅行”、“蜗牛”、“看书”的排名较高。

“允悲”这个词二胖都没有听说过,后经资深微博用户介绍才知道是“请允许我表达我的悲伤”的意思,看来二胖已经落伍了。“允悲”配合排名第二的“回来”一起,可以充分体会各位蛙爸蛙妈们对蛙儿子回家的盼望。

“出去”和“旅行”是蛙蛙们任性的日常,蛙爸蛙妈在微博的呼唤表达了对叛逆蛙儿子的担忧,但是蛙蛙在家看书和削木头的时候,难道不是你们怕蛙蛙在家憋坏了么?

果然,身为家长是矛盾的,既担心孩子远行有危险,又忧愁孩子在家闲着没出息。


Tips

 

数据来源:由二胖不辞辛劳在互联网上抓取

抽取用户数:15000人

抽取评论数:25000条

相关技术:自然语言处理_关键词提取

数据清洗:Python 3.6

数据可视化:Echarts 4.0

本公众号的一切内容源于一个程序员对生活和信息技术的热爱,希望通过大数据和计算机分享从不同角度看待的世界。

积极听取大家的建议和新奇idea,可直接回复后台或留言,感恩!

日后,本公众号将根据大家的实际需要免费推出计算机相关课程,如Python、网络爬虫、数据可视化、搜索引擎、量化交易等课程,大家记得关注哦!


微信公众号:二胖并不胖

知乎专栏:Data Talks

知乎:二胖

微博:二胖并不胖2018

二胖并不胖

长按识别二维码,关注二胖并不胖



    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存