【Nature 封面论文】随机人工智能群体控制，提高人类协作效率

2017-05-19 新智元

新智元编译

来源：Science、Nature

Science 报道作者：Matthew Hutson

编译：赵以文

【新智元导读】噪音，或过程中无意义的信息通常被视为导致麻烦的原因。但最新研究发现，将制造噪音（也即故意做出不协调行为或“捣乱”）的 bot 或 AI 程序放置在人类网络中的特定位置时，反而可以提高人类协作效率，解决从天文、考古乃至量子问题。

不可预测的人工智能（AI）听起来可不是件好事。但一项新的研究表明，随机运行的计算机可以促使人类更好地协调行动，更快地完成任务。该方法也可以用于缓解交通流量、改善企业战略，甚至可能改善或巩固婚姻关系。

如果想要把一个项目做得好，那么单是项目成员之间能够和谐共处是不够的，他们还需要有一个共同的执行目标。解决这个问题的方法有两个：一是自上而下的控制，也就是有一个人做领导或设置一个管理机构，告诉其他人都做什么；另一个更直观的做法是让项目成员随意选择自己最喜欢做的事情。根据所谓的“复杂系统理论”，后面这种方法最终将使整个系统融合一起。例如，要是两个人在谈判中陷入僵局，其中一人如果提出一个大胆乃至疯狂的方案，可能还会使谈判得出一个结果。

用简单巧妙的游戏验证噪音是否有益于协作

为了弄清楚随机 AI 能否帮助人类协调工作，耶鲁大学社会学家和系统工程师 Hirokazu Shirado 以及社会学家和医师 Nicholas Christakis 做了一项实验。他们要求参与实验的志愿者玩一个简单的在线游戏：有一个由 20 个节点构成的网络，每位志愿者分别控制中网络中的一个节点。这些节点呈绿色、橙色或紫色，志愿者可以随时改变自己控制的节点的颜色。

来源：Nature 同期评论“Occasional errors can benefit coordination”

这个游戏的目标是让两个相邻的节点不会出现相同的颜色。但是，玩家（也即实验参与者）只能看到自己控制的节点的颜色和与之连接的节点的颜色。所以，有时候会出现看不见的矛盾，比如玩家 A 让节点 A' 为橙色，与之相邻的节点 B' 为绿色，但同时与 B' 相邻的 C' 也被玩家 C 设定为橙色，而玩家 A 和 C 相互之间是看不见的，所以会造成冲突。

如果整个网络在 5 分钟之内实现了目标（相邻节点颜色不同），所有玩家都会收到额外的奖励。研究人员一共招募了 4000 名人类玩家，并将 230 个随机生成的 Bot 置于这个网络中。

图1：全部由人类玩家控制节点的结果。

因此，实验中，有些网络的玩家全部是人类。但在这些网络里，3 个处于中心或彼此连接节点数量最多的节点已经被上了色——要用 3 种颜色让有 20 个节点网络相邻节点颜色不同，有很多种解决方案，这些着色就满足其中的一种。

另一些网络则由 17 个人和 3 个 bot（或简单的 AI 程序）控制节点。在这些有 bot 控制节点的网络中，有的是将 3 个 bot 放在中心，有的则是将 3 个 bot 放置在网络的边缘，还有的则是 3 个 bot 位置随机。

这些 bot 在选择颜色时也会各不相同，因为研究人员事先设定好了噪声或选择颜色的随机性。在一些网络中，bot 每隔 1.5 秒会选择与当时网络中相邻节点颜色最多的不同颜色（比如 bot 有 5 个相邻节点，其中 3 个都是橙色，那么 bot 就会选择绿色或紫色。而在另一些网络中，bot 在 90% 的时间里遵循上述策略，但剩下 10% 的时间会随机选择节点颜色。还有一些网络，bot 随机挑选颜色的时间占 30%。

图2：曲线显示给定时间未解决的游戏次数百分比。深蓝色线条表示每次游戏的结果，包括 bot（n = 20），横轴表示 bot 的噪声水平，纵轴表示测地线位置（geodesic location）。浅蓝线条曲线表示仅由人类玩家（n = 30）控制的结果。n 总数 = 210。每次游戏时间为 300 秒；P 值是对数秩检验的结果。具有10 % 行为噪声并位于网络中心的 bot 可以显著提升游戏的可解性（P = 0.015），并且平均速度提升了 55.6%，从 232.4 秒到 103.1 秒。

实验结果：随机 AI 增加人类之间的协调性

实验结果，有 bot 混在其中的网络和全部由人类控制节点的网络表现都差不多，但那些有 3 个 bot 位于中心，并且这 3 个 bot 在 10% 的时间里随机挑选节点颜色的网络（下文简称为“3 中心 bot 10% 网络”），表现是最好的。这种组合的网络在时间限制内完成游戏目标的次数更多（85% 对 67%）。相关论文今天在 Nature 以短文（letter）的形式发表。

研究人员论文中写道，3 中心 bot 10% 网络在完成任务时，思考的时间为 103 秒，而其他则为 232 秒，这是一个非常显著的差距。

那些 bot 噪音为 0（也即全部由人类控制节点）或 30%（即 bot 有 30% 的时间随机选择颜色）的网络，完成游戏目标并没有超越全部由人类控制的网络，意味存在一个“Goldilocks 随机区域”（注释：Goldilocks 随机区域也叫“古迪洛克带”、“生命带”、“绿带”，是天文学上给一种空间的名称，在这种空间里，行星彼此之间的距离在一定范围之内。天文学家认为，在古迪洛克带中这样的空间，有利于生命的发展。太阳系就是一个古迪洛克带，而地球上诞生了高等生命。）

此外，有 bot 参与的网络与那些一开始就预设好 3 个节点颜色的网络表现一致。换句话说，预设节点的网络是从上到下控制的，但混入有噪声的 bot 也仅仅在局部增加了一些随机性，并没有影响整体结果。“我们得到的结果是一样的，”研究作者 Christakis 表示：“对我来说，这是个漂亮的结果。”

图3：对 bot 和网络特征进行分析后，得出完成游戏的结果

Bot 帮助人类帮助自己

进一步分析表明，由 bot 加入网络中的轻微噪音行为，有利于为网络中的其他人树立榜样。有些玩家也会在游戏中做出“噪音”，偶尔故意选择与相邻节点冲突的颜色。bot 的噪音水平影响了人类的噪音水平——即使 bot 控制的节点并没有与人类控制的节点直接相连，这表明了涟漪效应（ripple effect）的存在。

“Bot 在帮助人类帮助自己，”Christakis 说。没有 bot 的附加噪音，人类玩家往往每个人都选择与与相邻节点颜色冲突最小的颜色（还是以与 5 个节点相邻的节点为例，当其中 3 个都是橙色时，人类玩家往往会选择将自己控制的节点设定为紫色），但整个网络内仍然存在冲突。 “在某种程度上，这些 bot 发挥了某种教学能。”Christakis补充说。如果你看到一个相邻节点（由 bot 或人类控制）经常更换颜色，你也可以决定这样做。Christakis 指出，像 AlphaGo 这样非常复杂的 AI 程序可能会帮助人类玩家玩得更好，但是在这个实验里，即使是这些“单纯愚钝的 bot”，让对人类玩家达成目标起到了帮助作用。

图4：Bot 行为对人类玩家行为的影响

干扰会增加和谐是有前例的，比如随机突变有助于演化产生复杂生物体。“这是个很酷的小研究，”辛辛那提大学心理学家 Michael Richardson 说：“结果非常符合复杂系统理论。”

加州理工学院帕萨迪纳分校的经济学家 Colin Camerer 是该论文的评审人之一，他对两位研究人员使用简单、严谨的方法产生大量数据，证明随机性可以促进社会互动的秩序这一点表示了称赞。但 Camerer 指出，由于实验中使用的模型非常简单，“很难看出与现实世界组织中发生的事情有密切的关联。”

接下来，研究人员希望将研究的规模扩大，包括更加复杂和现实的合作，比如让人与 bot 共同完成军事任务或进行制造生产。

组织中得有“讨人厌的家伙”

除了引入噪音，bot 还可以在很多方面帮助人类。可以想象，聊天机器人介入婚姻关系协调，指导双反相互妥协而不是用愤怒或无聊来发泄。最近的一项研究发现，化身为人的 Tweetbot，能够让种族主义者感到羞愧，从而减少 Twitter 的种族诽谤言论。

论文的另一位作者 Shirado 说，bot 作为提出不同意见的一方是很好的，因为它们可以忍受愤怒。Shirado 以索尼的一个项目为例，有一位负责人提出不同意见，坚持推动其他人不想去做的视频游戏项目，最后成就了如今的 PlayStation。

让 Christakis 举例使，他提到一个十分富有但被很多人视为难以相处的朋友。“他告诉我，从类没有人邀请他担任董事会成员，因为他往往提出反对意见。”Christakis 说。“我把这篇论文给他，他说‘这太棒了！这证明了我的存在的方式！这就是为什么每个公司董事会都应该有一个像我这样讨人厌的人。’”

编译来源

Nature 论文 Locally noisy autonomous agents improve global human coordination in network experiments，doi:10.1038/nature22332 | http://nature.com/articles/doi:10.1038/nature22332
Science 报道http://www.sciencemag.org/news/2017/05/bad-bots-do-good-random-artificial-intelligence-helps-people-coordinate
Nature 同期评论 Simon Gachetro：Ocasional errors can benefit coordination

点击【阅读原文】查看新智元招聘信息。

反向激励，在加速这个社会的黑化

把抄袭说的如此冠冕堂皇，雷军让年轻人丢掉了耻辱感

2024【公共营养师】报名通道已开启，不限学历，23岁及以上可报!还能领2000补贴

Wealth | 中国成本轮金价涨势的前沿和中心

父亲出轨后，母亲对父亲实施了她的精确打击 | 二湘空间