微软AI打出吃豆人史上最高分
安妮 编译整理
量子位出品 | 公众号 QbitAI
AI把吃豆人打通关了。
△ 谷歌首页上的吃豆人游戏
目前,微软的一个AI系统在Atari 2600版的经典游戏吃豆人中获得最高分999,990分,用“分解攻克”的方式把游戏打通关了。
https://v.qq.com/txp/iframe/player.html?vid=g0514wkzrx1&width=500&height=375&auto=0
回顾一下之前的战绩,Highscore.com上的吃豆人得分榜显示,这个版本此前的最高分是266330分,成就属于一名巴西玩家。
△ 据Highscore统计,目前吃豆人最高记录是巴西玩家在2015年创下的
微软的解决方案被称为混合奖励体系结构(Hybird Reward Architecture),利用了150多个独立智能体协作处理游戏。一个“高级智能体”从其他智能体那收集建议,然后决定在游戏过程中屏幕里角色的移动路径。
吃豆人问题是对AI系统的一个考验。AI需将游戏解决方案分解成很多小步骤,然后在正确的时间将它们组合成正确的顺序。这个过程和人类大脑的工作方式非常相似。
此成就来源于今年1月刚被微软收购的加拿大AI创业公司Maluuba。在被收购前,Maluuba主要研究利用深度搜索和强化学习增强计算机自然语言读写和文本深度理解能力,还发布了自己的语音助手软件。Maluuba解释,之所以用Atari 2600版本来测试整这个AI系统,是因为此版本吃豆人已经被标准化,他们可以从中直接比较研究结果和方法。
这事说起来也很有意思,微软CEO Satya Nadella曾经打趣说,谷歌建立AI系统想要赢得围棋或星际争霸II这样的游戏,但微软是想建立能解决实际问题的AI。
研究人员希望将这项工作纳入其他人工智能研究领域,如自然语言处理。他们表示,这种方法可能会对教AI进行复杂任务产生广泛影响,从而增强人类能力。
【完】
一则通知
量子位正在组建自动驾驶技术群,面向对象为研究自动驾驶相关领域的在校学生或一线工程师~
欢迎大家加量子位(Qbitbot)备注:自动驾驶,申请加入哈~
One More Thing…
今天AI界还有哪些事值得关注?在量子位(QbitAI)公众号对话界面回复“今天”,看我们全网搜罗的AI行业和研究动态。笔芯~
△ 扫码强行关注『量子位』
追踪人工智能领域最劲内容