中国的足球队夺得世界冠军!
The following article is from 狂丸科学 Author 狂丸
「最终,比赛结束的哨声响起,各位观众,来自中国的WeKick足球团队,获得了本次挑战赛的冠军,让我们恭喜他们。」
恩等一下,中国足球队?夺冠?你没看错,在AI世界里,来自中国的足球团队WeKick,这次冲出了亚洲,在世界的舞台上,大放异彩。
他们获得冠军的这次赛事由Google Research和英超曼城足球俱乐部联合举办,是信息学国际性挑战赛举办平台Kaggle上的一项AI足球挑战赛,全球一共有1138只队伍参加。
尤其值得一提的是,WeKick足球队的战斗表现和战斗精神都可圈可点,最后一场比赛中,在落后两球的不利情况下,他们连进三球,最终实现了大逆转。
接下来,就让我们看看这场比赛,以及AI足球队是如何踢球的。
连进三球,成功逆转
连进三球,成功逆转
比赛中,我国的WeKick是红色一方,对手SaltyFish是蓝色一方,他们背后的数字,代表的是控制球员的球衣号码,而足球,则是那个白色字母B。
好的,比赛开始,让我们回到比赛现场。
对阵的双方,分别是WeKick和SaltyFish 。在派出的队员上,对阵的双方数值一样,是无差别的。此外,双方也都没有替补队员。
情况似乎有些糟糕,因为WeKick目前已经0比2落后了。
「传球」、「扑救」、「团队配合」、「远射」等等。这些正常足球场上会发生的操作,AI在游戏中操作起来也是娴熟无比。
这个WeKick,究竟是个啥?
这个WeKick,究竟是个啥?
实不相瞒,这个WeKick的真面目,其实就是:「绝悟」。是的,不用怀疑,就是王者荣耀里面的那个AI绝悟。
在王者荣耀的数据去训练的话,就是王者荣耀里的那个全英雄池的「绝悟完全体」,而如果用足球的数据去训练,就是这次比赛的「WeKick」。
(图源:腾讯AI Lab微信)
在赛后总结中,「绝悟」的研究团队向大家揭秘了这个AI背后的秘密。它的出现,一共可以分为三步:
首先,是通过强化学习和自博弈(Self-Play),从零开始训练模型。
不过,对于足球运动,如果只由进球与否来决定成败的话,其实并不利于模型的训练。于是,「绝悟」的研究团队在价值估计(奖励模式)上,进一步进行细化。
评价标准多样化之后,AI在训练过程中能更快得到反馈,然后进行下一步操作。
除了将奖励细分化,由于足球是一项团体配合的运动,所以「绝悟」的研究团队还使用了一种名为「生成对抗模拟学习」(GAIL)的技术来进行自博弈训练。
这项技术,可以模拟一些难以细化定量描述的战术,比如足球比赛中常见的「长传反击」、「控球渗透」等等。
通过模拟出不同战术风格的对手,然后让AI与其对抗,进行训练和学习。
最后,研究人员使用「基于 League 的多风格强化学习」这个方法进行补充训练,防止在赛场上见到一些奇怪的战术,会让AI一时间手足无措,自己先乱起来了。
这其实也是咱们普通人应付考试的时候,老师们经常会给出一些奇奇怪怪模拟试卷的原因。
参考资料:
https://www.kaggle.com/c/google-football
https://ai.googleblog.com/2019/06/introducing-google-research-football.html
https://github.com/google-research/football
https://www.youtube.com/watch?v=F8DcgFDT9sc&feature=emb_logo
https://mp.weixin.qq.com/s/D2uu6vaaPfQSDeLEGlaoCw
来源:狂丸科学
编辑:Kun
近期热门文章Top10
↓ 点击标题即可查看 ↓1. 你泡茶时没发现什么不对劲吗?爱因斯坦用它发了篇论文并开创了一个学科2. 究竟怎样才能早起不困啊!!!3. 学学北极人抗寒大法,你早晚用得上4. 尼古拉·特斯拉,到底有多神?5. 如果做不好科研,我就只能回去继承家产了6. 没有这项技术,赛博朋克2077就算残废?7. 超级黑PK超级白:纳米材料如何欺骗你的眼睛8. 为什么暖气片总会熏黑我的墙? | No.2369. 这个最最基本的问题,物理学家却还没有标准答案10. 学霸和学渣的大脑,有什么不同? 点此查看以往全部热门文章