听说公众号深圳卫健委被网友投诉尺度大,我抓取了所有文章标题和阅读数分析了下
苏生不惑第
308
篇原创文章,将本公众号设为星标
,第一时间看最新文章。
听说公众号深圳卫健委被网友投诉尺度大,还上了微博热搜:
为了验证下尺度有多大,我特意去搜索关注了这个号,顺便抓取了这个号的所有文章分析了下,抓取过程见之前文章一键下载公众号所有文章,导出文件支持PDF,HTML,Markdown,Excel,chm等格式 ,看这文章配图就比我的好看,有点击欲望。
抓取的历史文章列表包含文章标题,简介,作者和链接。
用python生成的词云展示下,看起来还比较正经。
然后用python计算下平均阅读数,在看数和点赞数,评论数暂时没抓取。
data=pandas.read_csv('深圳卫健委公众号文章列表.csv',encoding='gbk')
data.columns=['发布时间','文章标题','文章链接','文章简介','阅读数','在看数','点赞数']
print(data['阅读数'].mean())
print(data['在看数'].mean())
print(data['点赞数'].mean())
因为文章量太多了,只统计了近2年的数据,平均阅读数近9万,如果算近一年平均近10万,平均在看数508,平均点赞数797,看这个数据俨然一个顶级大号。
其中在看数最高的是去年这篇文章人体《健康经》 ,在看数6635。
点赞数最高是前天这篇文章为什么胸部不能乱揉?真的很危险! ,点赞数近万,可能因为上了微博热搜,很多人来围观了。
data['总数']=data['阅读数']+data['在看数']+data['点赞数']
data.sort_values(by=['总数'],ascending=False, inplace=True)
data.head(100).to_csv('统计.csv',encoding='utf_8_sig',index=False)
如果你有想抓取的公众号,可以在公众号微信联系我。
最近原创文章:
网易云音乐每天自动听歌300首升级LV10,b站每天自动签到升级LV6,京东每天自动签到领京豆,微信运动每天自动修改步数
分享几个音乐神器 APP,免费听全网音乐,一键解锁网易云音乐变灰歌曲
如果文章对你有帮助还请
点赞/在看/分享
三连支持下, 感谢各位!