查看原文
其他

透过日播放量超过6亿的《延禧攻略》,看2018视频网站格局

数据森麟 数据森麟 2019-06-23

作者介绍:徐麟,目前就职于上海唯品会产品技术中心,哥大统计数据狗,从事数据挖掘&分析工作,喜欢用R&Python玩一些不一样的数据

个人公众号:数据森麟(ID:shujusenlin),知乎同名专栏作者。


前言:

随着《延禧攻略》的播出,魏璎珞、富察皇后等各位后宫小主的命运时刻牵动着各位观众的心。同时爱奇艺也因为该剧的大火,收获了单日超过6亿的播放量。我们此次将对比各大视频网站2018年截止到8月18号的电视剧和综艺节目的播放情况,大家可以据此选择购买会员的视频网站(壕er可以无视,直接购买所有会员)。

01

数据来源

猫眼APP提供了每日各大视频网站的播放量,截图如下:


我们通过Fiddler分析得到数据接口地址, 以优酷网8月11号电视剧播放量为例: http://maoyan.com/proseries/api/seriesTopRank.json?platformType=1&seriesType=0&dateRange=0&date=2018-08-11

其中platformType=1表示平台为优酷,SeriesType=0表示类型为电视剧,dateRange=0表示为数据日榜,最后的date则为具体日期,代码如下:

play_data = pd.DataFrame(columns=['date','name','play_num','type','platform','monopoly'])
for i in range(03):
    for j in range(0,7):
        for date in pd.date_range('2018-01-01','2018-08-18',freq='D'):
            try:
                time.sleep(0.5
                url= 'http://box.maoyan.com/proseries/api/seriesTopRank.json?platformType='+str(j)+'&seriesType='+str(i)+'&dateRange=0&date='+str(date)[0:10]
                html = requests.get(url=url, cookies=cookie, headers=header).content
                data = json.loads(html.decode('utf-8'))['data']['seriesDailyRankList']
                for item in data:
                    play_data = play_data.append({'date':str(date)[0:10],
                                                  'name':item['name'],
                                                  'play_num':float(item['playCountDesc']),
                                                  'type':i,
                                                  'platform':j,
                                                  'monopoly':item['platformInfoDescV2']},
                                                 ignore_index=True)
                print(str(i)+' '+str(j)+' '+str(date)[0:10])                 
            except:


02

整体播放量

通过猫眼接口我们可以获得各大视频网站每天TOP30电视剧、TOP30网剧(我们统一为电视剧)和TOP30综艺节目的日播放量,以此对比视频网站2018整体的播放量,我们用R语言的ggplot完成数据可视化的部分:



可以看到在猫眼提供的七个视频网站中,搜狐、乐视、PP视频占比非常小。我们在后面的内容中将重点对比腾讯、优酷、爱奇艺和芒果四大视频网站。首先看一下整体播放量:



下面看一下剧集和综艺分别的播放量:




可以看到无论是剧集还是综艺,2018年迄今为止腾讯视频都处于领先地位。芒果视频在剧集的播放量相较于其他网站,播放量偏低,但在综艺方面已经超过了优酷,与爱奇艺基本持平。


03

月度播放量

在前言中我们提到了《延禧攻略》最近大火,我们通过月度数据看一下其近期是否带动了爱奇艺整体的电视剧播放量份额:



可以看到在1-7月电视剧播放量一直落后于腾讯,大部分时间落后优酷的爱奇艺在8月通过《延禧攻略》的播出实现了反超,由于同类型的《如懿传》已经定档在腾讯播出,爱奇艺能否继续保持优势也值得期待。

我们同时看一下综艺的月度数据:



腾讯从4月份开始,随着《创造101》等节目的播出,在综艺节目的播放量上遥遥领先于其他的视频网站,下半年能够延续该势头与其能否继续找到有爆点的节目息息相关。


04

独播数据

独播视频一直以来都是视频网站最为重要的资源,我们首先看一下整体独播占比随月度变化情况:



综艺节目的独播占比要高于电视剧,这与视频网站大力投入到自制节目有关,也使得喜爱综艺节目的用户对于网站会员的需求变大。同时可以看到6月以来的独播占比开始持续增加,都已经超过50%,这或许也将成为未来视频网站的一大趋势。

下面看一下各大网站分别的独播占比情况:



各大网站6月以来的独播占比都在显著提高,优酷的综艺节目独播占比基本上超过了9成。芒果随着新版《流星花园》的播出,独播占比也在快速提升,未来可能也会在电视剧播放量占到更高份额。


05

剧集对比

首先我们看一下平均日播放量(我们选取每个电视剧最高的五天进行评价)TOP25的对比及网站分布



《延禧攻略》在爱奇艺单个平台的单日平均播放量已经超过了除《恋爱先生》和《谈判官》外所有多平台播放的电视剧,并且与上述两部多平台总体剧集也十分接近。我们也更加深刻地理解了选取剧集对于视频网站的整体影响。

我们同时选出所有的独播剧集,对比独播剧集TOP25:



从数量上对比,优酷和腾讯处于明显的领先地位,并且都有爆款电视剧。而爱奇艺的《延禧攻略》和芒果的《流星花园》排名靠前,也相应提高了其在电视剧播放量上的份额,或许这也会促使这两个网站加大独播剧集的占比。

最后看一下综艺的情况:




显然腾讯在综艺节目方面处于明显的领先地位,无论是整体播放量还是独播资源播放量和数量都领先于其他的竞争对手。整体的发展趋势未来或许会促使更多的《创造101》诞生。

由于可视化代码比较多,而且重复性比较强,我们选取其中的独播剧集绘制部分语句来进行展示:

##绘制TOP25独播剧集数据

drama_agg_mon <- ddply(drama_stat_mon,.(name,monopoly,type),summarise,
                   total_play=sum(play_num))
drama_agg_mon <- drama_agg_mon[order(drama_agg_mon$total_play,decreasing = T),][1:25,]
drama_agg_mon$rank <- 1:25
drama_top_mon <- merge(drama_stat_mon,drama_agg_mon,all.x = FALSE,all.y = TRUE,by=c('name'))
ggplot(drama_top_mon,aes(x=reorder(name,-rank),y=play_num,fill=platform))+
  geom_bar(stat='identity',position = 'stack')+ggtitle('TOP25独播电视剧平均日播放量(亿)')+
  theme_wsj()+coord_flip()+
  scale_fill_wsj()+
  theme(legend.position = 'top',
        legend.title = element_blank(),
        legend.text = element_text(size = 25),
        panel.grid = element_blank(),
        axis.text.x = element_text(size=15),
        axis.text.y = element_text(size=20),
        strip.text.x = element_text(size=20),
        strip.text.y = element_text(size=20,angle = 0),
        plot.title = element_text(size=25,hjust=0.5))



为了方便大家交流关于数据分析&数据挖掘的相关内容,本公众号的交流群正式建立。欢迎扫描以下二维码加入我们的公众号交流群,如果人数超过100人可以扫描添加下方管理员微信号,让管理员帮忙加入群。

公众号二维码:

管理员二维码:



有好的文章也可以联系我与大家分享,需要获取代码或者转载本公众号文章,可以直接在公众号或者文章下方留言

往期文章

3天破9亿!上万条评论解读《西虹市首富》是否值得一看

“水泊梁山“互联网有限公司一百单八将内部社交网络

Python爬虫&可视化第1季-城市旅游数据分析

Python爬虫&可视化第2季-舌尖上的“小龙虾”

人工智能在京东金融中的应用

【读者来稿】Python&R爬取分析赶集网北京二手房数据(附详细代码)

【读者来稿】数据解读《爱情公寓》电影版——十年一瞬间


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存