AI终于掌握了Stratego博弈｜Science一周精选

Original 优睿科新闻平台 ScienceAAAS 2022-12-04

收录于合集 #Science一周精选 487个

点击上方蓝色字，关注我们

据研究人员报告，一种新开发的名为“DeepNash”的人工智能代理学会了具备人类专家水平的Stratego博弈；Stratego是AI还未掌握的少数棋盘游戏之一。这项研究的作者说，它代表了一个“非同寻常的结果，因为Stratego圈内人士认为，这是现有的技术水平不可能实现的。”

多年来，棋盘游戏Stratego一直是AI研究的下一个前沿领域之一。该游戏所测试的是一个人依次做出相对缓慢、审慎和逻辑决策的能力。作为一种“不完美的”信息游戏（即游戏中的某些玩法是向对手隐瞒的），Stratego给AI研究人员带来了重大挑战，因为它的结构有许多复杂的方方面面，其中包括它比另一经过充分研究的不完美信息游戏（即无限制德州扑克）拥有更多可能的状态。

目前，人们不可能用不完美信息搜索技术来掌握Stratego。Julien Perolat和同事在此介绍了一种新的方法，它能让AI来学习该游戏。这种新方法产生了一中名为DeepNash的机器人，它能在该游戏的最复杂变体“Stratego Classic”中展示人类的专家级表现。

DeepNash的核心是一种强化学习算法“R-NaD”。为制作DeepNash，Perolat和团队将R-NaD与深度神经网络架构结合，旨在学习在高度竞争层面进行博弈的策略。

DeepNash与各种最先进的Stratego机器人和专家级人类玩家进行了博弈测试。它战胜了其它所有的机器人，并在Gravon（一个互联网游戏平台，也是Stratego的最大在线平台）上与Stratego的专家级人类玩家进行了极具竞争性的对弈。

作者说，值得注意的是，这种博弈水平是在没有使用任何搜索方法的情况下做到的，而搜索方法是过去各种桌游中许多具里程碑意义的AI成就的关键组分。

欢迎关注Science官方公众号

点击下方“阅读原文”访问英文原文

为本期Science点亮你的赞吧

清华女神，34岁的美女博士县长，辞职了

薄公子低调成台湾女婿 23日已在台举办婚礼

警察殴打打人学生，舆论撕裂的背后

你手放哪呢，出生啊

故宫蛇年限定款藏书票，错过再等12年！

AI终于掌握了Stratego博弈｜Science一周精选

您可能也对以下帖子感兴趣

清华女神，34岁的美女博士县长，辞职了

薄公子低调成台湾女婿 23日已在台举办婚礼

警察殴打打人学生，舆论撕裂的背后

你手放哪呢，出生啊​

故宫蛇年限定款藏书票，错过再等12年！

生成图片，分享到微信朋友圈

AI终于掌握了Stratego博弈｜Science一周精选

您可能也对以下帖子感兴趣

你手放哪呢，出生啊