新的《星际争霸II》大师的诞生 |《自然》论文
目前,一款名为“AlphaStar”的人工智能程序排名进入即时战略游戏《星际争霸II》前0.2%的人类玩家之列。根据本周《自然》发表的一篇论文Grandmaster level in StarCraft II using multi-agent reinforcement learning,这款算法代表了机器学习的一大重要成就,经过改造或有助于解决其它应用领域的复杂问题。
训练设置 | 来源:Vinyals et al.
《星际争霸II》是一款科幻主题的策略游戏,有全球性的专业比赛,也是全球最赚钱的专业电子竞技之一。该游戏中有着三种特征和能力截然不同的种族,玩家控制其中一个种族,相互对抗。该游戏已经成为人工智能研究领域的一项巨大挑战;在之前的比赛中,虽然简化了游戏规则,人工编制特定动作序列或依赖超人类的功能(如每分钟执行上万次动作),人工智能体也无法与顶尖人类玩家抗衡。
英国伦敦DeepMind的Oriol Vinyals及同事展现了一款多主体增强学习算法——AlphaStar。在该算法中,若干深度神经网络主体相互竞争,生成大量的持续适应性策略和对策。之后,AlphaStar在一系列在线游戏中与人类玩家比赛,无论玩《星际争霸II》的哪一个种族,AlphaStar都达到了大师级水平。这标志着人工智能体首次在没有简化游戏的情况下,在专业电子竞技中达到了顶尖人类玩家的水平。
© nature
Nature|doi:10.1038/s41586-019-1724-z
点击“阅读原文”阅读论文
Grandmaster level in StarCraft II using multi-agent reinforcement learning
相关文章
版权声明:
本文由施普林格·自然上海办公室负责翻译。中文内容仅供参考,一切内容以英文原版为准。欢迎转发至朋友圈,如需转载,请邮件China@nature.com。未经授权的翻译是侵权行为,版权方将保留追究法律责任的权利。
© 2019 Springer Nature Limited. All Rights Reserved