查看原文
其他

数据分析视角:咪蒙凭什么写出那么火的文章

2017-11-04 书生婉悠 Python爱好者社区

作者:   书生婉悠

简书:http://www.jianshu.com/u/46175078f805


写这篇文章最主要的,是想说明数据和数据分析在工作和生活中的实用性和重要性,顺便说一说我认识的咪蒙。


很早很早之前就听过关于咪蒙的各种传说,其中,最让人羡慕的就是她坐拥千万微信公众号粉丝、单篇软文收入近70万、月薪6万的员工工资、几乎偏偏文章10W+,这样的成就对于新媒体乃至整个互联网行业都是神一样的存在。更夸张的是,当时见到稍微更新媒体沾边的朋友,张口就问我对咪蒙怎么看,当时就特别好奇她到底是怎么做到这样的成就。





      

鉴于微信公众号粉丝数据很难获取,因此这篇文章的数据主要来源于有2个:一是抓取咪蒙微博评论下的活跃粉丝数据一共是78429条;二是,采集咪蒙全部文章数据;


一、咪蒙粉丝男女比例:


在新媒体江湖中流传着“咪蒙的粉丝娶不起”这句话,虽然是调侃,但是从下图可以看出咪蒙的活跃粉丝女性占比达到78.58%,而男性只有21.42%,嗯,瞬间希望刚刚那句话不要成真。



      

二、咪蒙粉丝年龄分布

       

从年龄层面来看,咪蒙粉丝出生年份大都在1989-1999年之间,也就是年龄区间集中在18-28岁之间,其中最人数多的是处在23、24、25岁年龄层中,也就是说,咪蒙粉丝基本上是高中、大学、大学刚毕业未经历社会、家庭婚姻历练的“生活小白”。



      

三、咪蒙粉丝区域分布:

      

从分布区域来看,咪蒙的广东粉丝占比最大,其次是上海和北京,从大范围看,东部沿海城市分布较为集中。



接下来的第二部分主要通过抓取咪蒙的微信公众号文章,通过对文章标题和内容做结巴分词和词频分析处理,得到咪蒙选题方向、文章内容主题的数据支撑。


一、从总体上看:


对标题和标题分词后,再对分词做聚类分析,得到下图,从图上可以明显看到,特征点非常集中地分布在一起,突出反应了具有很明显的一致性,也就是说,从语义上和情感上,都具有数据分析的价值。



    

从整体词频来看,最为经常出现的关键词有:我们、喜欢、为什么、如何、男人、爱情、女生等,这也就是说咪蒙是非常擅长用这些关键词做,我们通过具体的标题来分析这些关键词:


1、出现频率最高的是“我们”,有下面这些标题:



      

咪蒙在她的文章中极其频繁地使用“我们”这个词,非常显而易见的是,她试图通过转换角色,让读者感同身受、产生共鸣。咪蒙非常懂得如何讨好她的重度读者,她的忠实粉丝是人生阅历和社会阅历几乎空白的少女,对未来的恐惧、成功、暴力、性、家庭、婚姻认知非常浅薄,因此她塑造的是一个恐惧失败、渴望成功、义愤填膺、粗暴直接的“我们”的形象,这是她和她的读者想要带入的形象。


2、其次频次出现的就是“爱”、“我爱你”、“喜欢”这类情感倾向明显的词:



      

情感,马斯洛需求表现出来的是最为直接的需求,此类文章,在数据分析中通常都是阅读量最高的文章。尤其是在高中、大学等刚开始接触感情、谈恋爱的时候,情感问题困扰着很多的人。而咪蒙很擅长写这样的文章,她更厉害的是很了解读者的心里所想,能通过种种手法让读者感同身受、让读者分不清文章里文章外。


3、第三个频繁出现的词是“如何”:



      

咪蒙的定位,是为年轻女性代言,试图以高于重度粉丝的年龄和阅历为制高点来扮演粉丝群体的旗手,会发现很多文章就是与这个群体谈心、八卦, 为她们呐喊、讲出心声。而这些包含“如何”的文章中,咪蒙就是要叫你很多东西,例如教育、婚姻、情感、交际等。


二、从标题上看:

     

与之前整体分词研究不同的是,这部分仅仅就标题而言,并且是对名词和情感词的标题来做分析的。

     

下图是对429篇咪蒙文章标题做分词处理,再列出所有词的词频,筛选出名词和部分动词,整理出这些词的出现次数。





     

发现3类词出现的品类是非常高的:

     

男人、男生、男朋友、男孩、屌丝 这5个词占比最高,达到 21%。

     

女人、女孩、女生、女神、少女、妇女 这6个词占比第二高,达到 17%。

     

婚姻、吵架、结婚、性生活、爱情、老公、出轨 等词占比第三高,13%。

     

组合起来可以发现,女人、女孩、女生、女神、少女、妇女在很大程度上都是喷击者,是高高在上的,是正确的一方,而男人、男生、男朋友、男孩、屌丝通常都是被喷击者,认为生活的不顺利是由他们造成的;喷击的内容往往都是婚姻、吵架、结婚、性生活、爱情、出轨,认为只要是个女的就值得一个有钱又努力的人来爱,只要是个女的就必须得拥有更好的伴侣。这就很大程度上击中涉世未深的少女的内心需求,成为了他们的不二选择的代言人。

      

接着再对这些标题做情感分析:





      

咪蒙文章标题的负面率是很高的,直接传达出各种性爱、资本崇拜、暴力主题的字眼随处可见,用直白甚至粗鲁的语言制造反转,而这恰恰是咪蒙的刻意为之,为了吸引眼球,讨好重度粉丝,刻意地制造话题,传达出消极和负面的价值观。从另一个角度来说,基于“可信”的事情,再通过粗暴、流氓的语言表达出来,或许在一定程度上能够使得压抑的年轻人得到释放吧。

      

三、从内容上看:





     

可以发现有一下3类特征:

     

1、类似朋友的名词同事、朋友、老师、老板、员工、助理、同学出现的频率非常高,这是她自己的创作秘诀,早在她的那篇《如何写出100000+的爆款文章》里就有提到:公开朋友的隐私是写出爆款文章的秘诀之一。于是,那些所谓的朋友被用来做“贱人”、“low逼”的例子,矮化、丑化所谓的朋友成为爆款文章的内容和手段之一。

      

咪蒙文章通常都是从身边朋友的故事开始,叙述一件特定的事情,然后她自己就陷入了恐慌和深思,再通过大量的举证引出她的价值观,没有小说的叙事语言,没有精确的描写刻画,没有精心设计的冲突转折,只有满篇的流水账,读起来多轻松呀。

       

2、占据2-7位的是:孩子、女生、同学、妈妈、男生、父母这些词汇,可以看出咪蒙依然重度探讨的是男女关系、婚姻关系、家庭关系,而充斥其中的结婚、出轨、吵架等两性的负面现象。

      

3、在分词的过程中发现,咪蒙的文章用词是比较零散的,词汇量大,单字词少,用很多短句堆砌起来,读起来相对顺滑,几乎没什么理解的难度,缩短思考的时间。咪蒙的心灵鸡汤配着朗朗上口的短句,在看故事中不知不觉就接收了她的观点。以下是网上的例子:


      

对于咪蒙,我个人来说,是既佩服又讨厌的。

      

我佩服的是她能够在这个浮躁的时代里,准确地把握客户需求,击中粉丝的内心需求,深谙传播之道,能够察觉到众生于世间的痛苦,并且准确的表达出来,这是需要十分强劲的功力的。

      

我佩服的是咪蒙的文笔,在《南都》十二年,居主编之位,创作出了不错的文章,特别是那篇《好疼的金圣叹》,嬉笑怒骂皆成文章,真的是一个有趣而又有才华的女人,或许我永远也到达不了她的高度。

      

我讨厌咪蒙,是因为我真的不喜欢伪女权和精致利己主义的价值观;讨厌的是作为公知却充斥着粗暴和低俗,用挑逗的文字激发人们不正确甚至是偏激的情绪;

     

一位网友说:咪蒙没有改造任何人的价值观,只是在迎合某些人的价值观。但注定我不是这群人中的任何一个人。

     

不管身处什么环境下,都要认真去经营自己的生活。

Python爱好者社区历史文章大合集

Python爱好者社区历史文章列表(每周append更新一次)

福利:文末扫码立刻关注公众号,“Python爱好者社区”,开始学习Python课程:

关注后在公众号内回复“课程”即可获取:

1.崔老师爬虫实战案例免费学习视频。

2.丘老师数据科学入门指导免费学习视频。

3.陈老师数据分析报告制作免费学习视频。

4.玩转大数据分析!Spark2.X+Python 精华实战课程免费学习视频。

5.丘老师Python网络爬虫实战免费学习视频。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存