其他

【Nature 封面论文】随机人工智能群体控制,提高人类协作效率

2017-05-19 新智元

  新智元编译  

来源:Science、Nature

Science 报道作者:Matthew Hutson

编译:赵以文


【新智元导读】噪音,或过程中无意义的信息通常被视为导致麻烦的原因。但最新研究发现,将制造噪音(也即故意做出不协调行为或“捣乱”)的 bot 或 AI 程序放置在人类网络中的特定位置时,反而可以提高人类协作效率,解决从天文、考古乃至量子问题。



不可预测的人工智能(AI)听起来可不是件好事。但一项新的研究表明,随机运行的计算机可以促使人类更好地协调行动,更快地完成任务。该方法也可以用于缓解交通流量、改善企业战略,甚至可能改善或巩固婚姻关系。


如果想要把一个项目做得好,那么单是项目成员之间能够和谐共处是不够的,他们还需要有一个共同的执行目标。解决这个问题的方法有两个:一是自上而下的控制,也就是有一个人做领导或设置一个管理机构,告诉其他人都做什么;另一个更直观的做法是让项目成员随意选择自己最喜欢做的事情。根据所谓的“复杂系统理论”,后面这种方法最终将使整个系统融合一起。例如,要是两个人在谈判中陷入僵局,其中一人如果提出一个大胆乃至疯狂的方案,可能还会使谈判得出一个结果。


用简单巧妙的游戏验证噪音是否有益于协作


为了弄清楚随机 AI 能否帮助人类协调工作,耶鲁大学社会学家和系统工程师 Hirokazu Shirado 以及社会学家和医师 Nicholas Christakis 做了一项实验。他们要求参与实验的志愿者玩一个简单的在线游戏:有一个由 20 个节点构成的网络,每位志愿者分别控制中网络中的一个节点。这些节点呈绿色、橙色或紫色,志愿者可以随时改变自己控制的节点的颜色。


来源:Nature 同期评论“Occasional errors can benefit coordination”


这个游戏的目标是让两个相邻的节点不会出现相同的颜色。但是,玩家(也即实验参与者)只能看到自己控制的节点的颜色和与之连接的节点的颜色。所以,有时候会出现看不见的矛盾,比如玩家 A 让节点 A' 为橙色,与之相邻的节点 B' 为绿色,但同时与 B' 相邻的 C' 也被玩家 C 设定为橙色,而玩家 A 和 C 相互之间是看不见的,所以会造成冲突。


如果整个网络在 5 分钟之内实现了目标(相邻节点颜色不同),所有玩家都会收到额外的奖励。研究人员一共招募了 4000 名人类玩家,并将 230 个随机生成的 Bot 置于这个网络中。


图1:全部由人类玩家控制节点的结果。


因此,实验中,有些网络的玩家全部是人类。但在这些网络里,3 个处于中心或彼此连接节点数量最多的节点已经被上了色——要用 3 种颜色让有 20 个节点网络相邻节点颜色不同,有很多种解决方案,这些着色就满足其中的一种。


另一些网络则由 17 个人和 3 个 bot(或简单的 AI 程序)控制节点。在这些有 bot 控制节点的网络中,有的是将 3 个 bot 放在中心,有的则是将 3 个 bot 放置在网络的边缘,还有的则是 3 个 bot 位置随机。


这些 bot 在选择颜色时也会各不相同,因为研究人员事先设定好了噪声或选择颜色的随机性。在一些网络中,bot 每隔 1.5 秒会选择与当时网络中相邻节点颜色最多的不同颜色(比如 bot 有 5 个相邻节点,其中 3 个都是橙色,那么 bot 就会选择绿色或紫色。而在另一些网络中,bot 在 90% 的时间里遵循上述策略,但剩下 10% 的时间会随机选择节点颜色。还有一些网络,bot 随机挑选颜色的时间占 30%。


图2:曲线显示给定时间未解决的游戏次数百分比。深蓝色线条表示每次游戏的结果,包括 bot(n = 20),横轴表示 bot 的噪声水平,纵轴表示测地线位置(geodesic location)。浅蓝线条曲线表示仅由人类玩家(n = 30)控制的结果。n 总数 = 210。每次游戏时间为 300 秒;P 值是对数秩检验的结果。具有10 % 行为噪声并位于网络中心的 bot 可以显著提升游戏的可解性(P = 0.015),并且平均速度提升了 55.6%,从 232.4 秒到 103.1 秒。


实验结果:随机 AI 增加人类之间的协调性


实验结果,有 bot 混在其中的网络和全部由人类控制节点的网络表现都差不多,但那些有 3 个 bot 位于中心,并且这 3 个 bot 在 10% 的时间里随机挑选节点颜色的网络(下文简称为“3 中心 bot 10% 网络”),表现是最好的。这种组合的网络在时间限制内完成游戏目标的次数更多(85% 对 67%)。相关论文今天在 Nature 以短文(letter)的形式发表。


研究人员论文中写道,3 中心 bot 10% 网络在完成任务时,思考的时间为 103 秒,而其他则为 232 秒,这是一个非常显著的差距。


那些 bot 噪音为 0(也即全部由人类控制节点)或 30%(即 bot 有 30% 的时间随机选择颜色)的网络,完成游戏目标并没有超越全部由人类控制的网络,意味存在一个“Goldilocks 随机区域”(注释:Goldilocks 随机区域也叫“古迪洛克带”、“生命带”、“绿带”,是天文学上给一种空间的名称,在这种空间里,行星彼此之间的距离在一定范围之内。天文学家认为,在古迪洛克带中这样的空间,有利于生命的发展。太阳系就是一个古迪洛克带,而地球上诞生了高等生命。)


此外,有 bot 参与的网络与那些一开始就预设好 3 个节点颜色的网络表现一致。换句话说,预设节点的网络是从上到下控制的,但混入有噪声的 bot 也仅仅在局部增加了一些随机性,并没有影响整体结果。“我们得到的结果是一样的,”研究作者 Christakis 表示:“对我来说,这是个漂亮的结果。”


图3:对 bot 和网络特征进行分析后,得出完成游戏的结果



Bot 帮助人类帮助自己


进一步分析表明,由 bot 加入网络中的轻微噪音行为,有利于为网络中的其他人树立榜样。有些玩家也会在游戏中做出“噪音”,偶尔故意选择与相邻节点冲突的颜色。bot 的噪音水平影响了人类的噪音水平——即使 bot 控制的节点并没有与人类控制的节点直接相连,这表明了涟漪效应(ripple effect)的存在。


“Bot 在帮助人类帮助自己,”Christakis 说。没有 bot 的附加噪音,人类玩家往往每个人都选择与与相邻节点颜色冲突最小的颜色(还是以与 5 个节点相邻的节点为例,当其中 3 个都是橙色时,人类玩家往往会选择将自己控制的节点设定为紫色),但整个网络内仍然存在冲突。 “在某种程度上,这些 bot 发挥了某种教学能。”Christakis补充说。如果你看到一个相邻节点(由 bot 或人类控制)经常更换颜色,你也可以决定这样做。Christakis 指出,像 AlphaGo 这样非常复杂的 AI 程序可能会帮助人类玩家玩得更好,但是在这个实验里,即使是这些“单纯愚钝的 bot”,让对人类玩家达成目标起到了帮助作用。


图4:Bot 行为对人类玩家行为的影响


干扰会增加和谐是有前例的,比如随机突变有助于演化产生复杂生物体。“这是个很酷的小研究,”辛辛那提大学心理学家 Michael Richardson 说:“结果非常符合复杂系统理论。”


加州理工学院帕萨迪纳分校的经济学家 Colin Camerer 是该论文的评审人之一,他对两位研究人员使用简单、严谨的方法产生大量数据,证明随机性可以促进社会互动的秩序这一点表示了称赞。但 Camerer 指出,由于实验中使用的模型非常简单,“很难看出与现实世界组织中发生的事情有密切的关联。”


接下来,研究人员希望将研究的规模扩大,包括更加复杂和现实的合作,比如让人与 bot 共同完成军事任务或进行制造生产。


组织中得有“讨人厌的家伙”


除了引入噪音,bot 还可以在很多方面帮助人类。可以想象,聊天机器人介入婚姻关系协调,指导双反相互妥协而不是用愤怒或无聊来发泄。最近的一项研究发现,化身为人的 Tweetbot,能够让种族主义者感到羞愧,从而减少 Twitter 的种族诽谤言论。 


论文的另一位作者 Shirado 说,bot 作为提出不同意见的一方是很好的,因为它们可以忍受愤怒。Shirado 以索尼的一个项目为例,有一位负责人提出不同意见,坚持推动其他人不想去做的视频游戏项目,最后成就了如今的 PlayStation。


让 Christakis 举例使,他提到一个十分富有但被很多人视为难以相处的朋友。“他告诉我,从类没有人邀请他担任董事会成员,因为他往往提出反对意见。”Christakis 说。“我把这篇论文给他,他说‘这太棒了!这证明了我的存在的方式!这就是为什么每个公司董事会都应该有一个像我这样讨人厌的人。’”


编译来源

  1. Nature 论文 Locally noisy autonomous agents improve global human coordination in network experiments,doi:10.1038/nature22332 | http://nature.com/articles/doi:10.1038/nature22332

  2. Science 报道http://www.sciencemag.org/news/2017/05/bad-bots-do-good-random-artificial-intelligence-helps-people-coordinate

  3. Nature 同期评论 Simon Gachetro:Ocasional errors can benefit coordination 




点击【阅读原文】查看新智元招聘信息。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存