MIT 研究组:别瞧不起僵尸粉,它们真能左右舆论!
导语
社交网络上的信息非常容易传播,这也给了不怀好意之人可乘之机。那些看似无关紧要的僵尸粉,可能就是某些人用来影响舆论的工具。
近日,来自麻省理工学院的团队发表了一项研究,通过分析 Twitter 上的机器人在舆论事件中的表现,证实了社交网络机器人可以对社交网络舆论产生很大的影响,不到用户总数1%的活跃机器人,就可能左右整个舆论风向!
论文题目:
The Impact of Bots on Opinions in Social Networks
论文地址:
https://arxiv.org/abs/1810.12398
改变整个选情,
仅需少数机器人?
2016年的美国大选,除了明面上的造势,在社交网络上也是暗流涌动,至今关于“有人恶意操控美国大选”的说法仍然不断。到底有没有人操控呢?MIT 的研究表明,至少有人利用机器人账号,试图影响双方在Twitter 上的支持度。
这是 Twitter 上讨论2016年第二次美国总统竞选辩论的用户网络可视化。节点大小与网络中观点追随者的数量成正比,节点颜色表示观点的价值取向,红色节点是支持唐纳德·特朗普的,蓝色节点是支持希拉里·克林顿的。我们可以看到,在这次辩论期间,双方在舆论上还是僵持状态。
研究者使用卷积神经网络和词嵌入技术,训练出了支持阵营分类模型,可以根据推文内容,给出用户观念的概率分布(支持希拉里还是特朗普)。在总的数据集77563个用户样本中,发现有非顽固用户有69861个,顽固用户有7702个,而这里面可能潜藏着许多僵尸粉。
揪出僵尸粉!
机器人账户都是自动发帖,内容不大会受到社交网络的影响,它们是顽固的,观点一般不会变。研究者只考虑机器人对其他用户观点的影响。所以首先要做的,就是识别出哪些用户实际上是机器人。
机器人、僵尸粉最大的特点是什么?是没人跟他互动。
研究者使用了MIT 研究者 Mesnards 和 Zaman (2018) 的算法,来识别机器人。这种算法能找出那些经常转发其他人推文、但很少被其他人@ 的账号。该算法与其他算法相比,精度更高,需要的数据量更少。
Zaman 算法的相关论文:
https://arxiv.org/abs/1806.11253
机器人检测算法,会判断某用户是机器人的概率,但实际操作中研究者发现,该算法把几个经常转发但不常被@ 的真实用户也当做了机器人。所以研究者对有实名认证的 Twitter 用户做了筛查,把他们都归为真实用户。
最终,研究者确定了396个 Twitter 机器人,其中260个支持特朗普(红色),136个支持希拉里(蓝色)。这些机器人不到数据集用户量的0.5%。
以0.5为界,左侧支持希拉里,右侧支持特朗普
网络舆论模型:
我们都受到偏执狂的影响
不论是真实的推特用户还是推特机器人,它们的三个基本操作是,关注、转发和评论(类似微博)。通过跟踪这些互动,研究者可以有效量化 Twitter 账号的行为。
直觉上,那些不太关注别人的用户,也不太可能关注你。而且社交圈子重叠很重要,如果 A 和 B 是好友,那么关注 A 的用户就有较大概率关注 B。虽然人们在收到新信息时会更新他们的观点,但这个过程会随着时间的推移而减弱,他们的观点会逐渐变得顽固。Zaman 认为,如果你已经掌握了很多信息,你就越来越难听从别人的观点,新说法不会改变你的看法。
该研究团队基于过往研究,给出了网络舆论模型的核心假设:
社交网络中的个人是基于其朋友推文中的观点,来更新自身的观点;
网络中某些用户的观点是顽固的,其观点不会轻易改变,而且顽固用户会推动其他用户(摇摆不定的中间派)改变观点。
根据观点的取向、强弱,把用户 i 的观点 θi 的范围设定在0-1的区间内,0表示绝对支持希拉里,1表示绝对支持特朗普。当用户的推文频率是 λ 时,网络舆论模型中,对于非顽固用户而言,其观点服从平衡方程:
可以借助电路来理解这个公式,电路的总电压,等于各个并联电路的电压之和。一个用户的观点,等于他好友观点的之和。如果 i 的好友中有至少一个顽固用户,那这个方程就有唯一的解——最终决定非顽固用户观点的,其实是他好友里面的顽固派!
为了研究如何用网络模型来预测社交网络上的观点变化,该小组研究了用户推文观点和他所处社交网络的平均观点之间,有怎样的相关性。对于非顽固用户而言,其所处社交网络的平均观点(纵坐标)都集中在 0.4-0.5 区间及附近。
这意味着,顽固的推特机器人,有可能把用户观点拉向某个极端,因此可以用网络舆论模型,来研究机器人如何改变用户所在社交网络的平均观点。
初步实验:
僵尸粉竟然能扭转乾坤!
为了验证这个网络舆论模型,研究者对2016年第二次选前辩论在 Twitter 上的讨论数据做分析。
研究者计算了四种情况下的网络舆情:没有机器人,只有支持特朗普的机器人,只有支持希拉里的机器人,以及所有机器人。由此得到了上面的观点累积分布图。
特征很明显,剔除机器人时,整体舆论是0.58,偏向希拉里;特朗普机器人将舆论使0.58转变了0.18,到0.76,而希拉里机器人将舆论使0.58转变了0.32,到了0.26。显然,支持希拉里的机器人对舆论的影响更明显!
为什么希拉里机器人数量比特朗普的少,但效果却强于特朗普的呢?
研究者做出两种可能的假设:
首先是希拉里机器人有更多的粉丝,它们接触的 Twitter 用户更多;
其次是希拉里机器人,推文频率更高。
毕竟按照网络舆论模型,非顽固用户比较容易受到那些高频发帖、粉丝众多的用户的影响。
进一步验证:
剔除僵尸粉的影响会怎样?
为了验证上述假设的正误,首先统计了社交网络上,机器人和真人的关注数和被关注数。发现希拉里和特朗普的机器人的主要关注者,并非机器人,而是真实用户!而且它们的分布没有显著差异。这就排除了第一种假设——“希拉里机器人粉丝更多”。
研究者又考虑推文率,即在该时间段的数据集中的推文数量。可以观察到,机器人平均发帖数量超过人两个数量级以上,并且克林顿的机器人发帖频率明显高过特朗普的。而希拉里和特朗普的真实支持者,推文率几乎一致。
为了消除发帖次数引起的偏差,研究者以相同的推文率,重新计算了网络舆论情况。发现当推文率和真实的人相同时,机器人改变舆论的能力大大降低:
所以就得出结论,希拉里机器人比特朗普机器人数量更少,效果更好的原因,是其推文更多。这也进一步验证了网络舆论模型的有效性。
社交媒体机器人,
也许是潜在的炸弹
如果没有这些活跃的机器人,这次辩论后 Twitter 上特朗普的支持度可能会下降0.18,希拉里的支持度可能会下降0.32。
麻省理工学院研究组的这项工作,最大的发现是,影响社交网络舆论所需要的机器人,其实是很少的。少数活跃的机器人,可以对网络舆论产生重大影响。
虽然社交媒体机器人不会带来物理威胁,但它们却可能有力影响到网络舆论。在微博里,各类水军已经经常出现在营销造势、危机公关中。虽然你能一眼识别出谁是水军,但仍然可能不知不觉地被他们影响。
这些机器人看似僵尸,发起声来,比人类响亮得多,可能只要几十个几百个就足够扭转舆论!
参考资料:
http://mitsloan.mit.edu/newsroom/articles/how-do-online-bots-shift-opinions/
作者:刘培源
编辑:王怡蔺
推荐阅读
AI&Society 学术沙龙
第十二期:计算社会科学
世界知名计算社会科学学者,芝加哥大学计算社会学硕士项目创始人James A. Evans ,受邀作为 AI&Society 沙龙第十二期的嘉宾,将结合多年的教学、研究、基金申请,与主持各类计算社会科学研讨会的经验,回顾与介绍计算社会科学发展的历史与现状,并展望该领域的未来发展。
时间:2018年11月7日(周三)14:00-17:00
地点:北京市海淀区知春路希格玛大厦
详情请见:芝大著名学者James Evans:计算社会科学的前沿与展望 | AI&Society第十二期预告
扫描二维码或点击阅读原文,填写报名信息
审核通过后,我们将以邮件、短信或微信等方式通知您
集智AI学园:
https://campus.swarma.org
集智俱乐部QQ群|877391004
商务合作及投稿转载|swarma@swarma.org
◆ ◆ ◆
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧!