查看原文
其他

在 B 站外,我用代码看到了另一批“后浪”!

程序人生 2020-10-29

The following article is from 凹凸数据 Author 等你下课

作者 | 等你下课

来源 | 凹凸数据(ID:alltodata)

昨天5.4青年节,朋友圈已经被《后浪》刷屏,相信大部分人都看过了小破站献给新一代的演讲(商业片)。
习惯性地打开了微博和知乎,想看一下别人的看法,想知道我是不是有些颓废而与这个社会格格不入?
当我打开了微博和知乎,我才发现《后浪》翻车了,原来我们都一样,都很难再感受到《后浪》中的激情和理想。在这里看着大家的评论和回答,就好像在看着自己过得生活,评论和回答太多,所以就直接爬了下来,然后上班的时候慢慢地看。
爬取的地址分别为:
  • 知乎回答:如何评价 B 站 2020 年五四青年节宣传短片《后浪》?
  • 人民日报微博“奔涌吧,后浪!这是#献给年轻一代的演讲#”下评论
  • bilibili献给新一代的演讲《后浪》弹幕
微博b站的代码参见我之前的文章,知乎的话以后再详细讲解。
作为一名数据分析师就习惯把手头的数据分析一下,所以也就拿这些数据简单的进行了一下分析。

评论情感倾向


先调用百度AI来分析微博和b站的评论情感倾向。
知乎的回答字数过多,做情感分析肯定不准确,就没做分析。
from aip import AipNlp
""" 你的 APPID AK SK """
APP_ID = '你的APP_ID'
API_KEY = '你的API_KEY'
SECRET_KEY = '你的SECRET_KEY '
client = AipNlp(APP_ID, API_KEY, SECRET_KEY)
text = "XXXXXXXX"
""" 调用词法分析 """
response = client.sentimentClassify(text)
# "sentiment":2,    //表示情感极性分类结果  0:负向,1:中性,2:正向
# "confidence":0.40, //表示分类的置信度
# "positive_prob":0.73, //表示属于积极类别的概率
# "negative_prob":0.27  //表示属于消极类别的概率
for info in response['items']:
    if info ['sentiment'] == 2:
        print("正向")
    if info ['sentiment'] == 0:
        print("负向")
    if info['sentiment'] == 1:
        print("中性")
    print("可信度:",info['confidence'])
    print("属于积极类别的概率是:",info['positive_prob'])
    print("属于消极类别的概率是:",info['negative_prob'])
需要注意的是,在各个平台评论最多的“奔涌吧,后浪!”,在百度AI中是个消极句子,需要特殊处理。
结果如下:
非常明显,b站的弹幕正向居多,而微博的评论负向居多。

词云


通过上文的情感分析,各家平台的用户对于《后浪》的态度各异,他们又是如何评价的呢?
统计评论和回答中的高频词,制作词云看一下吧。
from scipy.misc import imread
from wordcloud import WordCloud, ImageColorGenerator

isCN = 1 # 0:英文分词  1:中文分词
back_coloring_path = '浪花.jpg'          # 设置背景图片路径
text_path = 'reviews.txt'               # 设置要分析的文本路径
stopwords_path = 'stop_word.txt'        # 停用词词表
imgname1 = '词云图.png'  # 保存的图片名字1(只按照背景图片形状) 
back_coloring = imread(back_coloring_path)     # 设置背景图片 

wc = WordCloud(#font_path = font_path          # 设置字体
                font_path='C:\Windows\Fonts\simfang.ttf',
                #font_path='hanyiqihei.ttf',
                background_color = 'white',    # 设置背景颜色
                max_words = 3000,              # 设置显示的最大词数
                mask = back_coloring,          # 设置背景图片
                max_font_size = 200,           # 设置字体最大值
                min_font_size = 20,             # 设置字体最小值
                random_state = 42,             # 随机有N种配色方案
                width = 2000 , height = 1720 ,margin = 4 )
words = {}
for i in word_counts:
    words['{}'.format(i[0])] = i[1]

wc.generate_from_frequencies(words) 
# txt_freq例子为 { word1: fre1, word2: fre2,  word3: fre3,......,  wordn: fren }

plt.figure() 
B站
知乎
微博
知乎微博更多在围绕“现实”、“社会”、“房价”、“韭菜”之类的词汇,5.4青年节的这个时点,自然对于这类满满鸡汤的“励志视频”非常反感。
相反,在b站的用户看来,这是小破站在跨年晚会之后,再一次出圈并受到了主流媒体的认可,自然非常开心。

说说我个人的看法吧。
第一遍看的时候,被何冰老师的演讲给深深的折服,以青年宣言《后浪》为词,认可、赞美与寄语年轻一代。在UP主们的青春混剪中,属于年轻人的光芒正在闪耀。“你们有幸,遇见这样的时代,但时代更有幸,遇见这样的你们!”让我也在一瞬间热血沸腾,也有了想要转发的冲动,想让“前浪”看一下这就是我们“后浪”。就在想要点击转发的时候,我突然迟疑了,我现在还是“后浪”吗?
如果放在几年前,我想《后浪》中年轻人的模样就是我当年的模样,那个时候我在读大学,租住着全国最便宜的房子,吃着可口又便宜的饭菜,虽然兜里没有几个钱,但是我却的确可以像《后浪》中提到的,学一门语言,学一门手艺,喜欢摄影就去摄影,喜欢旅行就去旅行,这是我曾经的模样,也是在那时第一次接触到了B站,像打开一个新世界一样,于是顺理成章的成了小破站的粉丝。
但到了现在,我发现我可能很难在成为《后浪》中年轻人的模样,或者说是失去了好多选择的权利,看着弹幕中“奔涌吧!后浪!”,感觉自己可能只算的上是被后浪裹挟着的浮游,为了工作可能放弃了爱好,为了房子可能放弃了旅行,为了这个而又放弃了那个,选择的并不是我想要的选择,而是只剩下这个选择。
最终我没忍住,把后浪发给了一位比我年长的朋友,他发给我一个视频,可能这才是真的想说的吧。
视频:https://www.bilibili.com/video/BV1qa4y1i74i/


更多精彩推荐

全国程序员工资最新统计来了,平均 14,542 元!

老师,你确定Java注释不会被执行吗?

华为副总裁回应应用删除用户图片;美国拟允许华为参与 5G 标准建设;Firefox 76.0 发布 | 极客头条

蚂蚁金服高要求的领域建模能力,对研发来说到底指什么?

一文看懂主流区块链攻击底层逻辑 | 博文精选

饿了么交易系统5年演化史

你点的每个“在看”,我都认真当成了喜欢

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存