查看原文
其他

【HI+AI:人机协同 赋能未来系列】机器棋手背后的人脑实力

2016-10-24 洪小文 微软研究院AI头条

【编者按】计算机领域的热点总是在不断更替,从大数据到云计算再到人工智能,在这些热点的背后是专家学者们在这些领域一点一滴聚沙成塔的技术突破。关于人工智能,我们见证了近年来它从默默无闻到炙手可热的过程。继去年《我们需要什么样的机器人》之后,微软全球资深副总裁、微软亚太研发集团主席兼微软亚洲研究院院长洪小文再次撰文,与我们进一步分享他对人工智能的见解与洞察,成为《HI+AI:人机协同 赋能未来》系列。在本系列三篇文章里,洪小文博士将与读者交流AlphaGo战胜李世石这一标志性事件背后的意义,深入浅出地探讨人类智能与人工智能的区分与联系,以及我们应当如何看待人类与人工智能的关系。

《机器棋手背后的人脑实力》是《HI+AI:人机协同 赋能未来》三篇系列文章的上篇。在本文中,洪小文博士从AlphaGo战胜职业九段棋手李世石说起,分析这一事件背后所展示的人脑不可替代的优势。




从国际象棋、中国象棋到围棋,在所有不依赖运气而只考较实力的智力游戏领域,机器在与人类的对决中已展现出极为显著的优势。


在赢了与世界围棋冠军、职业九段棋手李世石的比赛之后,可以预计,AlphaGo无需多长时间便能横扫整个围棋世界。而当它战胜了所有可能与它匹敌的人类顶尖棋手后,它便会将“世界围棋第一高手”的荣耀保持到永久——除非又出现另一位算法更先进的机器棋手。


弈棋,这曾在过去无数个世代里为人类所自矜和赞咏的智力神话就这样被冷冰冰的机器打破,难怪很多朋友会自然延伸出机器越来越聪明的结论。的确,从人工智能技术发展的角度看,AlphaGo不啻为一座里程碑。和上个世纪末因击败人类国际象棋王者卡斯帕罗夫而名噪一时的“深蓝”不同——当年,“深蓝”的胜利可以主要归因于其运算速度足够快,且算法也得到了改进,但AlphaGo能创下纪录并不意味着其硬件能力已强大到可以穷举三尺棋枰上的所有组合。




穷举法简单说就是列出达成某个目标的所有可能性,并对每一种可能性都进行验证,进而确定通往结果的步骤是否可行。事实上,在AlphaGo这个围棋程序诞生前,靠穷举法下围棋基本是缘木求鱼,因为需要计算的可能性实在太多,靠现在的计算机还难以完成。让AlphaGo有别于“传统”的计算机弈棋机器的两根技能支柱,分别在于深度增强学习(Deep Reinforcement Learning)和自我对局(self-play)。在策略网络(Policy Network)与价值网络(Value Network)的训练下,AlphaGo不再遵循从存储的海量棋谱中搜索最佳应手的路数,而是能够自行生成对对手棋路的模拟、仿真及得失风险评估。


机器棋手确实为我们这些人工智能相关技术的研究者带来了很多启示。

  • 第一,这种围棋程序的自我博弈模式是否可以推及到别的领域——让图像识别系统生成无限图像(如人脸)来模拟,让语音识别系统生成各种嘈杂环境下的语音来锻炼辨别力,让实时翻译程序生成语法无误的例句乃至长文并译解为别种语言……类似模式若能在其他人工智能研究的旁支得以推及,将有可能大大推动这一领域的学术进展和应用变现。

  • 第二,尽管机器在围棋人机大战中取得了胜利,但其算法却是由人开发出来的,在我看来,这更能彰显人脑而非电脑的智慧。信息科技发展至今,无论从记忆还是运算能力看,人脑都再没可能赢电脑——就像比拼加减乘除和开根号,永远都是电脑快过人脑,但后者强于前者的地方在于,是人类发明了加减乘除和开根号的算法。下围棋又何尝不是这样?人也是在掌握了算法规律的前提下,将“思考”的能力赋予了机器。AlphaGo的背后是云,是无数台计算机,若单论计算资源与能力,它远远超过它的对手李世石,但人类棋手却能在这样的背景下与机器一竞高下,显然更了不起。再说,人脑还是某种意义上的清洁、低能耗系统——人类下围棋时动脑思考所消耗的能量与同一时间机器棋手所耗费的电能相比,全然不是一个量级。也就是说,有一些特定的事,如果由人来做,显然比依赖计算机来得更简单、更经济,因而也就更智能。

  • 第三,即便是承认机器下围棋的技艺已然比人类更强,但这并不意味着机器也能理解围棋(以及国际象棋、中国象棋等)蕴含的文化和哲学之美,不意味着机器能在对弈的过程中感受到那种唯有人才能体会的快乐与激情。在中国,围棋自古便被视为一种君子之技、怡情之艺,相传“尧造围棋以教子丹朱”,而后世之所以有那么多人嗜下围棋,所为的绝不仅仅是在咫尺之枰与黑白疆域间捭阖争胜,而更多的是借围棋来体悟世间至道、生存哲理。再回想阿城先生的小说《棋王》,主角王一生因能痴于棋,故能极于棋——故事的高潮是他以一敌九、大获全胜,但背后的思想却是“呆在棋里”、与世无争,是“夫唯不争,故天下莫能与之争”的道蕴与禅意。这境界是机器永远都不可能理解的。事实上,今天的人工智能能够辨认猫和狗,却不理解,也就是说只能做到某件事,而不是理解某件事,不理解为什么是这样。


还有个有趣的问题:在人类的围棋堡垒被攻陷后,有没有哪些智力游戏是机器始终无法做到百战百胜的?当然有。


我们将有助于益智的棋牌类游戏分为以下三种:第一种是机器用穷举法便可以所向无敌的游戏,譬如五子棋,其博弈树复杂度没那么高,几乎每一步都有最佳算法。第二种是不太容易用穷举法来保证胜利的游戏,国际象棋、中国象棋和围棋便是典型——如果延续穷举法的思路去“硬啃”,即便穷尽全世界10亿台计算机的计算能力,要彻底推算出棋枰上每一步落子的全部可能性也要花费1017到10140年。



第三种游戏除了和运算能力有关,还引入了运气元素,以至于运算能力的强弱不能完全决定胜负结果,例如麻将、德州扑克、桥牌等。玩这类游戏,人机对决是胜负难料——虽然假设玩无数局下来,胜率一定是机器更高,但机器无法保证自己每局必胜。毕竟,说到记牌、算牌,人脑固然弱于电脑,而且电脑还可以根据无数过往牌局来推测打哪张牌的赢率较大,但在无法看到其他对手底牌且不能通过察言观色、注意对手的小动作等方式来作出判断的情况下,电脑无法精确评估出胜算,也就不可能连战连赢。也正是由于存在着运气的元素,麻将等游戏的趣味性才大大增加——即便对手的头脑更好、技艺更高,也还是有人愿意加入战局一试运气。


小结一下我对机器棋手的看法,那就是,在人类开发的算法的加持下,机器棋手取得了胜利,但这恰恰证明了人脑的强大与优越。(未完待续)

当计算机的运算功能已经如此强大,那么人脑和计算机应该保持何种关系呢?在下一期,洪小文博士将会和大家讨论这个问题。微软研究院AI头条将持续连载《HI+AI:人机协同 赋能未来》系列文章,敬请期待,同时欢迎你提出自己的看法。


你也许还想看:


我们需要什么样的机器人

洪小文:与人工智能一起终生学习

通往人工智能梦想的隐形革命

微软人工智能计划背后的华人力量


微软研究院AI头条期待你的评论与投稿。

微软小冰进驻微软研究院微信啦!快去主页和她聊聊天吧。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存