查看原文
其他

MIT 研究组:别瞧不起僵尸粉,它们真能左右舆论!

刘培源 集智俱乐部 2019-04-10


导语

社交网络上的信息非常容易传播,这也给了不怀好意之人可乘之机。那些看似无关紧要的僵尸粉,可能就是某些人用来影响舆论的工具。


近日,来自麻省理工学院的团队发表了一项研究,通过分析 Twitter 上的机器人在舆论事件中的表现,证实了社交网络机器人可以对社交网络舆论产生很大的影响,不到用户总数1%的活跃机器人,就可能左右整个舆论风向!


论文题目:

The Impact of Bots on Opinions in Social Networks

论文地址:

https://arxiv.org/abs/1810.12398



改变整个选情,

仅需少数机器人?


2016年的美国大选,除了明面上的造势,在社交网络上也是暗流涌动,至今关于“有人恶意操控美国大选”的说法仍然不断。到底有没有人操控呢?MIT 的研究表明,至少有人利用机器人账号,试图影响双方在Twitter 上的支持度。

       

这是 Twitter 上讨论2016年第二次美国总统竞选辩论的用户网络可视化。节点大小与网络中观点追随者的数量成正比,节点颜色表示观点的价值取向,红色节点是支持唐纳德·特朗普的,蓝色节点是支持希拉里·克林顿的。我们可以看到,在这次辩论期间,双方在舆论上还是僵持状态。


研究者使用卷积神经网络和词嵌入技术,训练出了支持阵营分类模型,可以根据推文内容,给出用户观念的概率分布(支持希拉里还是特朗普)。在总的数据集77563个用户样本中,发现有非顽固用户有69861个,顽固用户有7702个,而这里面可能潜藏着许多僵尸粉。



揪出僵尸粉!


机器人账户都是自动发帖,内容不大会受到社交网络的影响,它们是顽固的,观点一般不会变。研究者只考虑机器人对其他用户观点的影响。所以首先要做的,就是识别出哪些用户实际上是机器人。

       



机器人、僵尸粉最大的特点是什么?是没人跟他互动。


研究者使用了MIT 研究者 Mesnards 和 Zaman (2018) 的算法,来识别机器人。这种算法能找出那些经常转发其他人推文、但很少被其他人@ 的账号。该算法与其他算法相比,精度更高,需要的数据量更少。


Zaman 算法的相关论文:

https://arxiv.org/abs/1806.11253


机器人检测算法,会判断某用户是机器人的概率,但实际操作中研究者发现,该算法把几个经常转发但不常被@ 的真实用户也当做了机器人。所以研究者对有实名认证的 Twitter 用户做了筛查,把他们都归为真实用户。


最终,研究者确定了396个 Twitter 机器人,其中260个支持特朗普(红色)136个支持希拉里(蓝色)。这些机器人不到数据集用户量的0.5%。


以0.5为界,左侧支持希拉里,右侧支持特朗普



网络舆论模型:

我们都受到偏执狂的影响


不论是真实的推特用户还是推特机器人,它们的三个基本操作是,关注、转发和评论(类似微博)。通过跟踪这些互动,研究者可以有效量化 Twitter 账号的行为。


直觉上,那些不太关注别人的用户,也不太可能关注你。而且社交圈子重叠很重要,如果 A 和 B 是好友,那么关注 A 的用户就有较大概率关注 B。虽然人们在收到新信息时会更新他们的观点,但这个过程会随着时间的推移而减弱,他们的观点会逐渐变得顽固。Zaman 认为,如果你已经掌握了很多信息,你就越来越难听从别人的观点,新说法不会改变你的看法


该研究团队基于过往研究,给出了网络舆论模型的核心假设:

  1. 社交网络中的个人是基于其朋友推文中的观点,来更新自身的观点;

  2. 网络中某些用户的观点是顽固的,其观点不会轻易改变,而且顽固用户会推动其他用户(摇摆不定的中间派)改变观点。


根据观点的取向、强弱,把用户 i 的观点 θi 的范围设定在0-1的区间内,0表示绝对支持希拉里,1表示绝对支持特朗普。当用户的推文频率是 λ 时,网络舆论模型中,对于非顽固用户而言,其观点服从平衡方程:

              

可以借助电路来理解这个公式,电路的总电压,等于各个并联电路的电压之和。一个用户的观点,等于他好友观点的之和。如果 i 的好友中有至少一个顽固用户,那这个方程就有唯一的解——最终决定非顽固用户观点的,其实是他好友里面的顽固


为了研究如何用网络模型来预测社交网络上的观点变化,该小组研究了用户推文观点和他所处社交网络的平均观点之间,有怎样的相关性。对于非顽固用户而言,其所处社交网络的平均观点(纵坐标)都集中在 0.4-0.5 区间及附近。




这意味着,顽固的推特机器人,有可能把用户观点拉向某个极端,因此可以用网络舆论模型,来研究机器人如何改变用户所在社交网络的平均观点。



初步实验:

僵尸粉竟然能扭转乾坤!


为了验证这个网络舆论模型,研究者对2016年第二次选前辩论在 Twitter 上的讨论数据做分析。


     

研究者计算了四种情况下的网络舆情:没有机器人,只有支持特朗普的机器人,只有支持希拉里的机器人,以及所有机器人。由此得到了上面的观点累积分布图。


特征很明显,剔除机器人时,整体舆论是0.58,偏向希拉里;特朗普机器人将舆论使0.58转变了0.18,到0.76,而希拉里机器人将舆论使0.58转变了0.32,到了0.26。显然,支持希拉里的机器人对舆论的影响更明显!


为什么希拉里机器人数量比特朗普的少,但效果却强于特朗普的呢?


研究者做出两种可能的假设:

  1. 首先是希拉里机器人有更多的粉丝,它们接触的 Twitter 用户更多;

  2. 其次是希拉里机器人,推文频率更高。


毕竟按照网络舆论模型,非顽固用户比较容易受到那些高频发帖、粉丝众多的用户的影响。



进一步验证:

剔除僵尸粉的影响会怎样?


为了验证上述假设的正误,首先统计了社交网络上,机器人和真人的关注数和被关注数。发现希拉里和特朗普的机器人的主要关注者,并非机器人,而是真实用户!而且它们的分布没有显著差异。这就排除了第一种假设——“希拉里机器人粉丝更多”。




研究者又考虑推文率,即在该时间段的数据集中的推文数量。可以观察到,机器人平均发帖数量超过人两个数量级以上,并且克林顿的机器人发帖频率明显高过特朗普的。而希拉里和特朗普的真实支持者,推文率几乎一致。




为了消除发帖次数引起的偏差,研究者以相同的推文率,重新计算了网络舆论情况。发现当推文率和真实的人相同时,机器人改变舆论的能力大大降低:



所以就得出结论,希拉里机器人比特朗普机器人数量更少,效果更好的原因,是其推文更多。这也进一步验证了网络舆论模型的有效性。  



社交媒体机器人,

也许是潜在的炸弹


如果没有这些活跃的机器人,这次辩论后 Twitter 上特朗普的支持度可能会下降0.18,希拉里的支持度可能会下降0.32。

       

麻省理工学院研究组的这项工作,最大的发现是,影响社交网络舆论所需要的机器人,其实是很少的。少数活跃的机器人,可以对网络舆论产生重大影响。


虽然社交媒体机器人不会带来物理威胁,但它们却可能有力影响到网络舆论。在微博里,各类水军已经经常出现在营销造势、危机公关中。虽然你能一眼识别出谁是水军,但仍然可能不知不觉地被他们影响。


这些机器人看似僵尸,发起声来,比人类响亮得多,可能只要几十个几百个就足够扭转舆论!


参考资料:

http://mitsloan.mit.edu/newsroom/articles/how-do-online-bots-shift-opinions/


作者:刘培源

编辑:王怡蔺



推荐阅读


Nature:你此刻的快乐有20%的概率会转为悲伤

如何根据社交网络演化识别极端恐怖组织的形成?

危机:21篇顶刊社会科学论文仅有13篇可以复现

数字时代的社会生态学:全球化与复杂问题

加入集智,一起复杂!


AI&Society 学术沙龙

第十二期:计算社会科学


世界知名计算社会科学学者,芝加哥大学计算社会学硕士项目创始人James A. Evans ,受邀作为 AI&Society 沙龙第十二期的嘉宾,将结合多年的教学、研究、基金申请,与主持各类计算社会科学研讨会的经验,回顾与介绍计算社会科学发展的历史与现状,并展望该领域的未来发展。


时间:2018年11月7日(周三)14:00-17:00

地点:北京市海淀区知春路希格玛大厦


详情请见芝大著名学者James Evans:计算社会科学的前沿与展望 | AI&Society第十二期预告


扫描二维码或点击阅读原文,填写报名信息

审核通过后,我们将以邮件、短信或微信等方式通知您


集智AI学园:

https://campus.swarma.org




 

集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

◆ ◆ ◆

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

让苹果砸得更猛烈些吧!

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存