查看原文
其他

对战全程视频!顶级高手苦练DOTA半辈子,就这样被AI击败

2017-08-12 专注报道AI 量子位
李林 若朴 假装发自 西雅图
量子位 报道 | 公众号 QbitAI

一直只听说你们AI圈要打星际,怎么忽然打起DOTA了!

今天一早,AI似乎震惊了不少同学:在堪称“DOTA圈世界杯”的TI7邀请赛上,顶级选手被AI完爆。而且,这个AI只训练了两周……

https://v.qq.com/txp/iframe/player.html?vid=y1322jjm8lp&width=500&height=375&auto=0 先来看下最后分出胜负时的画面

看AI完虐顶级选手Dendi

在TI7主舞台上被AI“完爆”的,是Dendi,NAVI战队的乌克兰职业DOTA2选手,从DOTA1开始打了小半辈子,擅长中单solo,被评价为大局观强,操作犀利,手速极快

Dendi同时也是一名非常有想象力的选手,他经常会做出令人意想不到的事情,但往往也能收到意想不到的效果。

可惜,这次他遇到了可惜遇到了AI。

打败了Dendi的这个AI,是马斯克等人创立的人工智能非营利机构,OpenAI悄无声息研究出来的,如今一举搞了个大新闻。

第一局,开场5分钟,Dendi就打出了gg;

第二局,从开始到gg不到3分钟。

Dendi的手都在抖。

Dendi也不是唯一的“受害者”,上周,这个AI还和世界级中单1v1选手SumaiL、被称为“天才少年”的Arteezy等很多职业玩家交过手,都没输。

我们再来看一下刚刚出炉的Dendi被虐全程视频:

https://v.qq.com/txp/iframe/player.html?vid=g0536nln273&width=500&height=375&auto=0 大战全程视频

AI如何学会打DOTA?

说公道话,你们邀请汽车参加人类赛跑,这本来就不合适。不过,我们接下来还是要科学地分析一下DOTA2这个赛场,和这位横空出世的AI选手。

对于AI来说,DOTA 1v1是一个包含隐藏信息的复杂游戏,想要打好这个游戏,AI需要学会计划、攻击、欺骗对手。

而且,不要以为AI是靠手速快取胜的,虽然我们平时会称赞某些玩家手速快,但APM并不是决定游戏胜负的关键,这个AI的APM也并不比人类高。

要在DOTA里获胜,需要玩家对对手的操作建立一种“直觉”,然后做出应对。比赛结束后,OpenAI还在YouTube上专门发视频秀了一下各种操作:

https://v.qq.com/txp/iframe/player.html?vid=s05363y887a&width=500&height=375&auto=0

这个AI现在会补刀、会卡位、会长途追击敌方英雄,也会诱敌到塔下。也就是说,它掌握了通过当前的状况,预测地图上其他单位会如何移动的技能。

这些技能,完全是通过自己和自己对局学会的,而且没有用到模仿学习、树搜索等模型。

 从左到右分别是:Dendi、主持人、两位OpenAI研究员、OpenAI的主机箱

OpenAI的研究员在赛后采访中说,他们的AI从零开始达到这个水平,只需要两周;要打败DOTA的内置程序,也就是和普通玩家一样能打得过电脑,只需要再训练一个小时。

“Bloody hell!”主持人听完给出了一句简短的回应。

训练AI打DOTA只是第一步,这个项目的终极目标,是让AI能在杂乱的、甚至有人类内的环境中完成设定的目标,比如说外科手术。

当然,打DOTA这个问题也还没有真的完成,现在还只是1v1,让AI学会合作打5v5,还有很长的路要走。

AI打得怎么样?玩家这么说

怎么看这件事?这是Reddit上最好的一条评论。来自网友Screye,量子位搬运如下。

好吧,我对DOTA还算有所了解(玩了8年)。我试着谈一下。

事件:

这个AI击败了一众顶级DOTA玩家。(Sumail,RTZ,Dendi)

环境:

两名玩家在一条峡谷对攻,获胜条件是摧毁对方的防御建筑,或者杀掉对方两次以上。每30秒会有一波兵线进入峡谷,帮助应用攻击对方。杀敌对方的兵线可以获得金钱,并购买装备提升等级。

对战采用了迷雾模式,每个玩家只能看到附近一定距离内的情况。不过需要强调的是,这种1v1的对战,并不是DOTA游戏正常的模式(5v5)。

不过这种1v1的对战,的确可以用来在两个玩家之间一决高下,看看谁的操作技能更好。

数据:

AI是跟自己对战训练的。不过,DOTA的各种对战视频,或者说人类玩家的相关数据,都是可以公开获得的。

基本动作:

一个专业DOTA玩家大约每分钟要执行200-300个操作,包括行动、法术、攻击等命令。在这方面,AI的手速应该不会弱于人类顶级玩家。

高级动作:

DOTA中的英雄角色攻击之前,会配有特定的动作,这些动作施展之后,可以诱使对手也施展特定动作的回应,此时玩家可以发出命令取消动作。

另外法术和技能释放之后,会有一个冷却时间,在这段时间里这个法术或技能无法再次释放,所以这些都是有限的资源,如何使用也是一种技巧。

当然这些高级动作远不止这些。

游戏:

在这次的对抗中,人工智能已经掌握了上述基本和高级动作,而且会用多种不同的策略展开攻击。而且有很多需要一年以上联系才能掌握的高级操作,例如Creep pulling,coolodown,mana abuse以及动画取消。

总之,人工智能的风格似乎非常“人性化”,不像是一个机器。

结论:

DOTA是一个依赖战略(宏观和微观)的游戏,现在人工智能也杀进来了,我觉得这是一个大事儿。这个游戏需要考虑多方面因素,例如伤害的输出、承受,法力和技能的消耗与冷却等等,这些很难,我很想知道人工智能的策略到底是怎样指定的。

—— ——

加入社群

量子位AI社群7群开始招募啦,欢迎对AI感兴趣的同学,加小助手微信qbitbot2入群;


此外,量子位专业细分群(自动驾驶CVNLP机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。


进群请加小助手微信号qbitbot2,并务必备注相应群的关键词~通过审核后我们将邀请进群。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI

վ'ᴗ' ի 追踪AI技术和产品新动态


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存