第三讲,我来讲讲新时代的人工智能。接下来我要说的这个事件,想必大家都知道。
2016年3月,阿尔法围棋(AlphaGo)与围棋世界冠军、职业九段棋手李世石进行了一场围棋人机大战,阿尔法围棋以4比1的总比分获胜。
同学们必须知道,AlphaGo可不是阿尔法狗,GO表示的是围棋,阿尔法围棋。
2017年5月,在中国乌镇围棋峰会上,升级版的阿尔法围棋(AlphaGo)又与排名世界第一的世界围棋冠军柯洁对战,以3比0完胜。围棋界公认阿尔法围棋的棋力已经超过人类职业围棋顶尖水平。
阿尔法围棋(AlphaGo)是一款围棋人工智能程序。其主要工作原理是"深度学习"。"深度学习"是指多层的人工神经网络和训练它的方法。阿尔法围棋用到了很多新技术,如神经网络、深度学习、蒙特卡洛树搜索法等。
说到阿尔法围棋(AlphaGo),我们就必须要谈到一个人,就是它的研发者戴密斯·哈萨比斯(Demis Hassabis)。
戴密斯·哈萨比斯是人工智能企业家,DeepMind Technologies公司创始人,人称"阿尔法围棋之父"。4岁开始下国际象棋,8岁自学编程,13岁获得国际象棋大师称号。
他在1988年世界国际象棋青少年锦标赛中获得了12岁组的世界亚军(插一句,你们知道那一年12岁组的男子世界冠军是谁吗?女子组冠军又是谁呢?有趣的是,12岁组的两个世界冠军都是女孩子,男子组实际上叫公开组,是允许女孩子参加的,当年被小波尔加获得。女子组是我们中国的女棋手诸宸,她后来又赢得了女子世界冠军)。
哈萨比斯那年也挺倒霉的(笑),他完全有能力走的更远,冲击世界冠军,他是个天才。但是这个棋手,很快就放弃了走国际象棋职业道路,他或许觉得国际象棋只是一个小众的项目。
据说8岁时,他开始思考两个问题:第一,人脑是如何学会完成复杂任务的?第二,电脑能否做到这一点?
16岁时,他进入剑桥大学计算机科学专业;17岁时,他设计出游戏《主题公园》,是最早包含人工智能元素的游戏之一。后来又成立电脑游戏公司。2014年他将自己的公司DeepMind卖给谷歌,价格据说高达4亿英镑(约合6.5亿美元)。
2005年,哈萨比斯回归学术领域,在伦敦大学学院攻读认知神经科学博士学位。开创性地发现大脑中海马体与情景记忆间的关系。他的研究成果在2007年被顶级学术期刊《科学》评为"年度突破"。他在大学期间参加了围棋的社团。
当时国际象棋的软件已经达到及超越人类世界冠军的水平,那么,国际象棋的棋盘是八乘八64个格,围棋呢?大家都知道是19×19这么大的一个棋盘!棋盘每增大一圈,都会引发更多的计算。
我觉得哈萨比斯的心理:我没空跟你玩(战胜你),我做个程序把你打败!
阿尔法围棋(AlphaGo)的版本,结合了数百万人类围棋专家的棋谱,以及强化学习进行了自我训练。一出道就旗开得胜!
但哈萨比斯并不追求这种满足。他需要达到这样的高度,他要研发的是真正的人工智能。所以在阿尔法围棋(AlphaGo)之后,又出现了一个新的版本,叫做AlphaGoZero(从零开始?)。
AlphaGoZero的能力在Alpha Go的基础上有了质的提升。最大的区别是,它不再需要人类数据。也就是说,它一开始就没有接触过人类棋谱。研发团队只是让它自由随意地在棋盘上下棋,然后进行自我博弈。
是一个深度学习、自我学习的真正智能的AI。
AlphaZero使用新的强化学习方法,让自己变成了老师。系统一开始甚至并不知道什么是围棋,只是从单一神经网络开始,通过神经网络强大的搜索算法,进行了自我对弈。随着自我博弈的增加,神经网络逐渐调整,提升预测下一步的能力,最终赢得比赛。更为厉害的是,随着训练的深入,阿尔法围棋团队发现,AlphaZero还独立发现了游戏规则,并走出了新策略,为围棋这项古老游戏带来了新的见解。
最近我很关注一个比赛,WCCC,我前面提到的。Lc0软件赢得了这场比赛的冠军。开源Lc0项目的灵感来自AlphaZero。
比赛一共有24款强大的软件参与:
1. Lc0*;2. Stockfish;3. Fizbo;4. Komodo;5. Laser;6. Shredder 7. Leelenstein*;8. BlackMamba;9. Schooner;10. Fire 11. Xiphos;12. Andscacs;13. Antifish*;14. Rofchade 15. Arasan;16. Houdini;17. Protector;18. Senpai 19. Allie*;20. Wasp;21. Texel;22. Bobcat 23. Komodo Monte Carlo;24. Ethereal
我不再一一列举,事实上我也不完全能叫出这些软件的名字。比赛总共进行了1404场,持续42天。
我看到这样的比赛,真正是不眠不休,他们毫无情感的进行一轮又一轮的比赛,一轮结束,马上下一轮就开始,一天24小时不间断。
大家可以想象啊,这样的非常强大的人工智能在不断的学习中,让自己变得更加的强大是多么可怕的一件事情。
人们现在也不再讨论人脑厉害还是电脑厉害,人工智能软件在我们这个国际象棋行业中已经是无所不在,它充当着教练员的身份,指导我们对棋有更深的学习和了解。它甚至在比赛中作为作弊的工具也在频繁使用。
在柯洁与阿尔法的人机大战后,阿尔法团队宣布阿尔法围棋将不再参加围棋比赛。阿尔法围棋将进一步探索医疗领域,利用人工智能技术攻克现实现代医学中存在的种种难题。实际上,对付人类棋手从来不是"阿尔法围棋"的目的,开发公司只是通过围棋来试探它的功力,而研发这一人工智能的最终目的是为人类造福。
最后,我们用2018年中国科幻作家刘慈欣的话作为结尾:在被问及人工智能是否会威胁到人类时,刘慈欣表示,目前的人工智能水平,距离电影中的强人工智能还有不小的差距,现在的人工智能,前面有多少智能后面就有多少人工。
刘慈欣也谈到了他认为的真正的智能,"真正的智能是什么?这个机器能通过图灵测试,但假装通过不了;AlphaGo赢不了柯洁,恼羞成怒,拿起棋盘往柯洁脑袋上砸。这才是真正的人工智能。"
谢谢大家!
★附:
世界计算机国际象棋锦标赛 (WCCC)
世界计算机国际象棋锦标赛 (WCCC) 始于1974年。该比赛定期举办,是计算机国际象棋引擎之间的大比拼。比赛由国际计算机游戏协会组织,常常与计算机奥赛一起举办。计算机奥赛除了国际象棋之外,还包含若干其他棋类。
需要说明的是,世界计算机国际象棋锦标赛期间,这些引擎并不使用引擎协议,而是由人类操作员在物理棋盘上完成对局。世界计算机国际象棋锦标赛 (WCCC) 面向对所有类型的计算机,包括微处理器、超级计算机、集群和专用国际象棋硬件。
历届WCCC的比赛冠军
世界国际象棋软件锦标赛
自2010年起,一项新的世界锦标赛被引入。而且与世界计算机国际象棋锦标赛在同一地点和同一时期举行。世界国际象棋软件锦标赛的规则规定,参赛程序必须在相同硬件规格的机器上运行。时限为每方45分钟,每步棋加15秒。
历届"世界国际象棋软件锦标赛"的冠军
点按“阅读原文”,可参与留言互动。
相关阅读