查看原文
其他

从记者的Twitter关注看他们稿件的党派倾向?

陈帅彤 大邓和他的Python 2022-07-09

这篇论文属于社会计算方向,一般会用到社交媒体数据做研究,分析方法一般会用到文本分析。这篇文章文本数据处理感觉还是挺技术的,可以借鉴一下

  • 构建词典-使用词频比构建党派倾向(共和or民主)词典
  • 用户评价矩阵- 使用记者-国会议员关注矩阵识别记者社交媒体账号的意识形态倾向

文末有视频观看地址


左倾右倾


文献综述


论文中没有使用lda主题模型,而是使用的比较简单好懂的词典法做的意识形态的主题划分。

研究数据


研究方法

使用记者-国会议员关注矩阵识别记者社交媒体账号的意识形态倾向。这里我也不懂GAM,但感觉这里我们可以通过奇异值分解得到每个记者的特征向量,如果不同GAM,可以通过聚类,簇数为2,应该可以大致划分出左倾记者和右倾记者。

  1. 公式中的两个log相减,实际上是两个分数的相比。

  2. S(t)得分大于0,意味着左侧的分数比右侧分数大。

  3. 左侧是共和党,右侧是民主党

  4. 如果S(t)得分大于0,则表示这个词共和党用的更多,可以看做共和党特征词。反之,民主党用词

  1. s(j)公式与上一个公式一样,都是做的比值运算。

  2. 如果s(j)大于0,则右倾(共和党); 反之,则左倾(民主党党)

研究结果

讨论

总结

往期文章

读完本文你就了解什么是文本分析
综述:文本分析在市场营销研究中的应用
Pandas时间序列数据操作
readability: 英文文本数据可读性库
Matplotlib可视化教程~
Matplotlib中的plt和ax都是啥?
70G上市公司定期报告数据集
5个小问题带你理解列表推导式
文本数据清洗之正则表达式
Python网络爬虫与文本数据分析
如何批量下载上海证券交易所上市公司年报
Numpy和Pandas性能改善的方法和技巧
漂亮~pandas可以无缝衔接Bokeh
YelpDaset: 酒店管理类数据集10+G


先有收获,再点在看!



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存