查看原文
其他

AI终于掌握了Stratego博弈|Science一周精选

优睿科新闻平台 ScienceAAAS 2022-12-04

点击上方蓝色字,关注我们


据研究人员报告,一种新开发的名为“DeepNash”的人工智能代理学会了具备人类专家水平的Stratego博弈;Stratego是AI还未掌握的少数棋盘游戏之一。这项研究的作者说,它代表了一个“非同寻常的结果,因为Stratego圈内人士认为,这是现有的技术水平不可能实现的。”

多年来,棋盘游戏Stratego一直是AI研究的下一个前沿领域之一。该游戏所测试的是一个人依次做出相对缓慢、审慎和逻辑决策的能力。作为一种“不完美的”信息游戏(即游戏中的某些玩法是向对手隐瞒的),Stratego给AI研究人员带来了重大挑战,因为它的结构有许多复杂的方方面面,其中包括它比另一经过充分研究的不完美信息游戏(即无限制德州扑克)拥有更多可能的状态。

目前,人们不可能用不完美信息搜索技术来掌握Stratego。Julien Perolat和同事在此介绍了一种新的方法,它能让AI来学习该游戏。这种新方法产生了一中名为DeepNash的机器人,它能在该游戏的最复杂变体“Stratego Classic”中展示人类的专家级表现。

DeepNash的核心是一种强化学习算法“R-NaD”。为制作DeepNash,Perolat和团队将R-NaD与深度神经网络架构结合,旨在学习在高度竞争层面进行博弈的策略。

DeepNash与各种最先进的Stratego机器人和专家级人类玩家进行了博弈测试。它战胜了其它所有的机器人,并在Gravon(一个互联网游戏平台,也是Stratego的最大在线平台)上与Stratego的专家级人类玩家进行了极具竞争性的对弈。

作者说,值得注意的是,这种博弈水平是在没有使用任何搜索方法的情况下做到的,而搜索方法是过去各种桌游中许多具里程碑意义的AI成就的关键组分。

欢迎关注Science官方公众号

点击下方“阅读原文”访问英文原文

为本期Science点亮你的赞吧

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存