首页
下载应用
提交文章
关于我们
🔥 热搜 🔥
1
百度
2
今日热点
3
微信公众平台
4
贴吧
5
opgg
6
dnf私服
7
百度贴吧
8
知乎
9
dnf公益服
10
百度傻逼
分类
社会
娱乐
国际
人权
科技
经济
其它
首页
下载应用
提交文章
关于我们
🔥
热搜
🔥
1
百度
2
今日热点
3
微信公众平台
4
贴吧
5
opgg
6
dnf私服
7
百度贴吧
8
知乎
9
dnf公益服
10
百度傻逼
分类
社会
娱乐
国际
人权
科技
经济
其它
清华女神,34岁的美女博士县长,辞职了
薄公子低调成台湾女婿 23日已在台举办婚礼
警察殴打打人学生,舆论撕裂的背后
你手放哪呢,出生啊
故宫蛇年限定款藏书票,错过再等12年!
生成图片,分享到微信朋友圈
2022年12月4日
2022年12月4日
查看原文
其他
AI终于掌握了Stratego博弈|Science一周精选
Original
优睿科新闻平台
ScienceAAAS
2022-12-04
收录于合集 #Science一周精选
487个
点击上方蓝色字,关注我们
据研究人员报告,一种新开发的名为“DeepNash”的人工智能代理学会了具备人类专家水平的Stratego博弈;Stratego是AI还未掌握的少数棋盘游戏之一。这项研究的作者说,它代表了一个“非同寻常的结果,因为Stratego圈内人士认为,这是现有的技术水平不可能实现的。”
多年来,棋盘游戏Stratego一直是AI研究的下一个前沿领域之一。该游戏所测试的是一个人依次做出相对缓慢、审慎和逻辑决策的能力。作为一种“不完美的”信息游戏
(即游戏中的某些玩法是向对手隐瞒的)
,Stratego给AI研究人员带来了重大挑战,因为它的结构有许多复杂的方方面面,其中包括它比另一经过充分研究的不完美信息游戏
(即无限制德州扑克)
拥有更多可能的状态。
目前,人们不可能用不完美信息搜索技术来掌握Stratego。
Julien Perolat和同事在此介绍了一种新的方法,它能让AI来学习该游戏。
这种新方法产生了一中名为DeepNash的机器人,它能在该游戏的最复杂变体“Stratego Classic”中展示人类的专家级表现。
DeepNash的核心是一种强化学习算法“R-NaD”。为制作DeepNash,Perolat和团队将R-NaD与深度神经网络架构结合,旨在学习在高度竞争层面进行博弈的策略。
DeepNash与各种最先进的Stratego机器人和专家级人类玩家进行了博弈测试。它战胜了其它所有的机器人,并在Gravon
(一个互联网游戏平台,也是Stratego的最大在线平台)
上与Stratego的专家级人类玩家进行了极具竞争性的对弈。
作者说,值得注意的是,这种博弈水平是在没有使用任何搜索方法的情况下做到的,而搜索方法是过去各种桌游中许多具里程碑意义的AI成就的关键组分。
欢迎关注
Science
官方公众号
点击下方“
阅读原文
”访问
英文原文
为本期
Science
点亮你的赞吧
您可能也对以下帖子感兴趣
{{{title}}}
文章有问题?点此查看未经处理的缓存