查看原文
其他

盘点!2017这些世界冠军惨遭无情吊打

2017-12-31 二岳初 读芯术

科技时代,我们更加怀念温暖邂逅的时光

后台回复“想要”,得到近期有温度的推荐

全文共2927字,预计阅读时长3分钟



上世纪90年代末,IBM的“深蓝”与世界冠军加里•卡斯帕罗夫进行了一系列国际象棋比赛。


在1997年,深蓝最终击败了卡斯帕罗夫,这是机器第一次在比赛中击败世界冠军。到本世纪早中期,这项技术已经进步到了一定程度,在几乎所有不同玩法的游戏中,机器都在不断地打败国际象棋大师。

 

自然而然地,人工智能开发者开始转向其他更复杂的游戏,以测试他们日益复杂的算法。在过去的12个月里,人工智能跨越了一系列的新门槛,最终在各种不同的游戏中击败了人类玩家,从古老的围棋游戏到动态互动的纸牌游戏,德州扑克。


从国际象棋到围棋


上世纪90年代末,机器终于彻底打败了国际象棋大师后,计算机科学家们又把研究的注意力转向围棋,这是一个来自中国的古老的策略游戏,非常容易学会,但是很难做到精通。


在过去的十年中,机器学习的发展创造了真正有竞争力的人工智能围棋选手。2014年,谷歌开始开发一个名为AlphaGo的深度学习神经网络。在经历了几年的接近成功之后,开发团队尝试了一些不同的东西。


2017年5月,AlphaGo “Master”打败了柯洁——世界上排名第一的围棋选手。在AlphaGo和柯洁对战的三场比赛中,这台机器一直处于优势地位,但最令人吃惊的是,在10月份的时候,谷歌已经研究出了一个比“Master”更先进的AlphaGo版本。



这款名为AlphaZero的新人工智能可以在几小时内掌握多种游戏。通过 8 小时自我训练战胜李世石版本 AlphaGo; 12 小时自我训练战胜世界顶级国际象棋程序 Stockfish;14 小时自我训练战胜世界顶级将棋程序 Elmo。


AlphaGO 的重要开发者黄士杰称,AlphaGo 成功的背后是结合了深度学习、强化学习与搜索树算法三大技术。


但 AlphaGo Zero 与 AlphaGo 不同,它没有被输入任何棋谱,而是从一个不知道围棋游戏规则的神经网络开始,仅通过全新的强化学习算法,让程序自我对弈,自己成为自己的老师,在这过程中神经网络不断被更新和调整。


黄士杰说,“计算机围棋 AI 的价值在于帮助人类或棋手扩展围棋的理论和思路,未来 AI 是人类的工具,跟人类合作,而非跟人类对抗。强人工智能还是 Far Away,现在最强的学习技能仍在人类的脑袋里”。


掌握扑克牌中的“欺诈”术


围棋和扑克采用是两种完全不同的模式。要想在扑克游戏中取胜,需要掌握一定的欺诈技能。欺诈以及识别他人的欺诈是在纸牌游戏中取胜需要掌握的关键技能。


来自加拿大阿尔伯塔大学的研究人员推出了一个人工智能系统,DeepStack,它可以用一种人工智能形式的“直觉”来全面控制人类扑克玩家。


在今年 1 月宾夕法尼亚州匹兹堡的 Rivers 赌场,由卡耐基梅 42 35384 42 14987 0 0 4016 0 0:00:08 0:00:03 0:00:05 4015大学团队研发的人工智能系统 Libratus 和 4 位德州扑克顶级选手展开了一场为期 20 天的鏖战,经过 12 万手牌的比赛,Libratus 获得了最终胜利,赢取了 20 万美元的奖金。




无限德州扑克是一种“不完全信息博弈”,相较于围棋难度更大,因为它不仅信息缺失非常严重,而且策略以及心理等因素都能影响胜局。


利用在匹兹堡超级计算机中心大约 1,500 万核心小时的计算,它会先让 Libratus 反复地进行自我博弈,随机地玩上万亿手扑克,不断地试错,建立自己的策略,最终达到顶尖扑克玩家的水平。


Libratus 可以通过强大的计算和统计能力,把各种打法杂糅,并通过推理对其进行任意排列,将下注范围和随机性提高到人类牌手无法企及的程度,让人类玩家难以猜测电脑手中到底握有什么样的牌。


尽管专业人士每天晚上都在讨论他们可以利用人工智能的哪些弱点,但这台机器每天都在改进自身,修补游戏玩法中的漏洞,改进策略。


人类的大脑无法与机器匹敌,在经过近一个月的不间断游戏之后,这台机器总共赢了170万美元,而这4位专业人士中的每一位都损失了数千美元的虚拟货币。其中一名专业玩家对《连线》杂志说:“在这次激烈的比赛中,我感觉自己在和一个作弊的人比赛,就好像我的牌可以被他看到一样。我不是在指责它作弊。这其实是一件好事。”


AI制霸电竞: Open AI 完虐《Dota2》


“请放过我吧!”


如此痛苦的求饶,谁能想象是从Dendi口中说出的。


Dendi是谁?



如果你玩过《Dota2》这款游戏,那么相信你或多或少的都会对Dendi这个名字有些印象。这位出生于 1989 年的乌克兰老司机,可以说是整个世界上最顶尖的电子竞技选手之一,曾经随队在第一届 Dota2 国际邀请赛(TI1)上夺得冠军,又在后面的两届 TI 上斩获亚军。


而就是这样一位有着强横实力的选手,却在Dota2国际邀请赛结束后的表演赛上输的如此彻底,而他的对手则是一个 U 盘,确切点说,是 U 盘当中装着的由 OpenAI 开发的 Dota AI。


在这种格局的游戏中,OpenAI的机器人完全占据了主导地位。双方交锋过程中,在第一场比赛期间,主持人问Dendi:“你感觉它想一个‘人类选手’吗?”Dendi回答说:“不,这家伙真的很可怕。”他不停地说着,面对机器人放狠招,他还一度大叫:“请放过我吧!”第一局比赛中,OpenAI机器人仅用10分钟就击败了Dendi,第二场机器人在开场的几分钟内无情地痛打了他一顿,他便投降主动放弃了比赛。


当然,对于 OpenAI 的胜利,官方也公布了其独门秘诀,要知道它之所以强大的原因就在于它并没有通过模仿学习和搜索策略来进行训练,而是完全通过“自我对决(Self-Play)”的方式来提升自己的水平。并且在整个提升的过程当中,AI 从最早随机浑噩的状态逐渐进化到世界冠军级的单挑水准,仅仅花费了两周的时间。


AI将开始设计游戏


从 AlphaGo 惊人学习能力,到牌场一霸 Libratus,再到制霸电竞 Open AI,属于人工智能的 2017 年给了我们许多好奇、兴奋与惊喜。


如果人工智能在几乎每一场比赛中击败我们,那我们下一步该干什么?


法尔茅斯大学的一名研究人员最近公布了一种机器学习算法,他声称这一算法可以为我们创造出自己的游戏,我们从零开始玩游戏。这个人工智能系统名为Angelina,它每天都在不断改进自己,但目前它已经可以利用从维基百科共享到在线报纸以及社交媒体等各种来源的数据集制作游戏。


那么这一切意味着什么呢?


也许2017年最重大、最可怕的发展是强化学习系统的巨大进步。这些程序可以有效地教会它们自己如何掌握新技能。例如,最近的AlphaZero迭代可以在几天的自主学习之后,在一些游戏中获得超能力。



一项对350多名人工智能研究人员进行的大规模调查显示,人工智能还不足以打败我们。这项调查预测,在10年内,人工智能将会比我们更优秀,到2049年它将能够写出一部畅销小说,到2053年,它将会比人类在外科手术中表现的更好。事实上,该调查得出的结论是,到2060年,人工智能将有50%的几率能够完成我们所能做的所有事情,并且效果会更好。


2017年无疑是人工智能在日益复杂的游戏中打败人类的里程碑式的一年,尽管这看起来是一项微不足道的成就,但它的影响是巨大的。许多这些人工智能开发公司正迅速将目光投向现实世界的挑战。


谷歌DeepMind已经将AlphaGo Zero的系统应用到了其他领域,并进行了一项有关蛋白质折叠的全面研究,以期揭示治疗阿兹海默和帕金森等疾病的治疗方法。


读芯君开扒


我们与AI之间的关系在不同领域的交流中变得多元而亲密,我们质疑、揣测、焦虑、恐慌,但我想更多的是惊喜和惊叹。我们惊喜于人类对科学的探索能力以及对技术的创造能力,同时惊叹于人工智能在各个领域所创造的辉煌和成就。


2017注定是不平凡的一年。随着个大规模、更深度、更强交互性的机器学习,人工智能的能力极限不断地挑战着我们的认知。由人工智能的进步而逐渐显露出来的未来智能生活的冰山一角,就足以给我们巨大的想象空间。AI将与我们的生活越来越紧密,提高我们工作生活质量的同时,也给我们带来思考。


即将到来的新的一年,人工智能将会通过何种方式刷新我们的认知呢?让我们拭目以待。


留言 点赞 发个朋友圈

我们一起探讨AI落地的最后一公里


作者:二岳初

参考文献链接:

http://www.sohu.com/a/213149322_102883

http://tech.163.com/17/1228/10/D6O252H900098IEO.html

http://news.szhk.com/2017/08/14/282977654872680.html


如需转载,请后台留言,遵守转载规范


推荐文章阅读


颤抖吧!不懂Python语言,你将是新一代文盲

你说“我很好”,其实是你在逞强

不怕看AV,就怕看AV的人还懂AI!

小朋友都看得懂的AI发展史

南大闯进野猪 有AI就好了

三大“AI码农”:我的起薪30万 (上)

三大“AI码农”:我的起薪30万 (下)

想死?AI不同意!

世界首位机器人“公民”索菲娅称家庭很重要

前沿 | 性爱机器人上市,你会和她啪啪啪吗

独家点评 | 外媒眼中最酷的10大机器学习应用

这5个产业,将被人工智能彻底改变


长按识别二维码可添加关注

读芯君爱你


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存