AI超会团! 策略协作型AI“绝悟”首次露面KPL总决赛惊艳全场!
在刚刚结束的2018KPL秋季赛总决赛上(12月22日),腾讯AI Lab与王者荣耀及王者荣耀职业联赛共同探索的前沿研究项目——策略协作型AI“绝悟”首次露面,接受前KPL职业选手和职业解说组成的人类战队(平均水平超过99%玩家)的5V5水平测试,并取得胜利。
AI“绝悟”亮相,惊艳总决赛
在这场比赛中AI战队使用了达摩、阿轲、干将莫邪、典韦、张飞对阵人类战队的花木兰、赵云、小乔、项羽、牛魔。
比赛前期,AI战队的表现和人类战队相比确实缺少了几分灵动,被打出0-5的劣势,让很多观众一度产生“人工智能也不过如此的感觉”。但接下来AI战队的表现是真的惊艳到了大家。
AI“绝悟”操作亮点
AI达摩红buff处的一次漂亮的蹲点,直接用大招将赵云推上墙然后跟闪现秒杀出乎了所有人的预料,也展现了AI的意识和智慧。在引得现场观众一阵惊呼的同时却又让他们感觉到一点点眼熟,这操作我们好像在BA.一诺身上见过。没错,TS.暖阳也有过这样的操作!
AI干将莫邪配合AI达摩精准秒杀,同时被敌方项羽牛魔两人近身竟有条不紊逃生,极其亮眼。那种潇洒和随性哪有一点人机的感觉?AI这是师从Hero.久诚?
但最让人惊讶的是,AI真的超级会打团,依靠着优秀的团队协作配合最终一点一点扳回劣势,逆风翻盘赢得了比赛。这也再次说明王者荣耀强调的是团队协作配合,通过团队共同的努力取得最后的胜利正是王者荣耀最大的魅力!
在逆风翻盘打团获胜后,这个策略协作型AI“绝悟”也激起了众多观众与玩家的好奇:“绝悟”AI是如何训练成长的?它的技术背景是怎么样,为什么王者荣耀会来合作探索这样一个领域?绝悟AI会应用在哪里?
AI“绝悟”的训练与成长
“绝悟”首先通过监督学习方法,深度模仿 KPL 职业玩家的数据;其次,会进行大量自我对战,每天的训练强度最高能达到人类150年的训练量。
算法上,模仿人类的决策方法,综合考虑小地图信息、己方视野和英雄属性等多个维度特征,让它兼具大局观与微操,决定在游戏的什么时间该去哪里(去上、中、下路或野区等、单人或配合队友站位),要做什么(游走杀人Gank、带兵线、支援或反野),及具体微操怎么做(确定各自站位和角色、组合技能并释放)。
并在此基础上还研发出多个具有针对性的强化学习训练模型,,通过奖惩机制鼓励“绝悟”做有益团队的行为,有效提升了团战中的协作能力。
AI“绝悟”的技术背景
策略协作型 AI 是攻克 AI 终极研究难题——通用人工智能(Artificial General Intelligence,下称 AGI )的关键一步。AGI 代表研发能在通用系统中执行多种复杂命令,达到或超越人类水平的 AI ,从担任中国国家围棋队训练专用 AI 的“绝艺”,到寓意拥有“绝佳领悟能力”的“绝悟”。
不断让 AI 从0到1去学习进化,并发展出一套合理的行为模式,这中间的经验、方法与结论,长期来看,有望在大范围内,对医疗、制造、无人驾驶、农业、智慧城市管理等领域带来更深远影响。
而想要探索攻克策略协作型AI,需要一个合适的训练场景。王者荣耀是一款多人在线战术竞技(MOBA)类游戏,对战在两个团队(每队5名玩家)展开,地图包括上、中、下三条路线,以先推倒对方水晶防御塔为胜利判定标准。
对战中,在庞大且有不完备信息的地图上,10位参与者要在策略规划、英雄选择、技能应用、路径探索及团队协作上面临大量、不间断、即时的选择,形成了极为复杂的局面,预计有高达10的20000次方种操作可能性。
若 AI 能在如此复杂的环境中,学会跟人一样实时感知、分析、理解、推理、决策到行动,就可能在多变、复杂的真实环境中发挥更大作用。因此业界认为下一个 AI 里程碑,可能会在复杂策略游戏中诞生。
AI“绝悟”的应用
在KPL赛场上,我们的电竞职业选手也需要手眼脑协调、即时策略决策、团队协作精神及大量刻苦训练。策略协作型AI“绝悟”的出现,可以帮助这些职业选手进行更专业化、数据化的训练。借助在算法和数据方面的优势,为他们提供数据、战略与协作类实时分析与建议。
值得强调的是:策略协作型AI“绝悟”目前只会应用在电竞领域,而不是游戏内,召唤师们不会在正式服的任何PVP对局中遇到“绝悟”。
策略协作型AI“绝悟”的出现,不仅仅只是2018年王者荣耀职业联赛(KPL)秋季赛总决赛的惊鸿一瞥。这标志着腾讯AI Lab与王者荣耀共同开启了对“AI+电竞”的全新探索,向“通用人工智能”这一AI终极命题进一步迈进。
听说好看的召唤师都点了这里
▽▽▽