查看原文
其他

AlphaGo的胜利告诉我们什么

2016-03-16 杨一帆 混沌巡洋舰

作者简介:


杨一帆

系统与进化生物学博士,2015年毕业于法国国立医学研究院和巴黎第五大学,北京大学元培学院理学学士,生物和数学专业。现于巴黎交叉学科研究中心研究细胞衰老的机理与进化。



1997年,DeepBlue险胜卡斯帕罗夫之后,对人工智能和自动化未来的讨论,就在西方社会逐渐升温。本周DeepMind的AlphaGo击败李世乭九段的新闻,也吸引了中国公众对人工智能的想象力。计算机称冠人类最复杂的图盘游戏意味着什么?人工智能是否已超越人类智能?谷歌是否掌控着世界未来的神奇算法?笔者为从事系统与计算生物学研究的学者,业余跟踪人工智能领域的发展。作为一个身处生物学与计算科学交叉处的行外人,想把AlphaGo胜利的意义,放在更大背景中讨论,希望能对更广大范围公众有所贡献,也请行家指正。其中简短介绍的技术细节,近日也有多篇更专业的文章介绍,以及AlphaGo在Nature上的论文,请大家参阅。


AlphaGo如何攻克了围棋


围棋之所以被视为人工智能的一块试金石,是因为直接计算最佳策略的复杂度过高(底数接近361的指数增长),不能被过往DeepBlue所用的暴力计算方法所征服。人类围棋棋手使用所谓“棋感”,将棋盘分为不同作战的局部,并同时关注每个局部互相之间的关联。这样才能把大问题分小,又同时不脱眼大局。因此围棋这种通过“直觉”来进行的动态策略规划,相比更依赖运算和记忆的国际象棋,被很多人视为更加复杂的智力游戏。这也是过去围棋程序一直无法超过人类棋手的壁垒。


人工智能领域的一个基本假说,认为人类直觉无非就是神经系统对过去经验中经常出现模式的归纳总结。人工神经网络(Artificial Neural Network,ANN)就是对这一过程进行模拟的计算架构。ANN看名字神秘,原理其实很简单:为了学习一个未知的输入输出关系,把输入中每一个维度分配一个权重,该权重决定每个输入维度的重要性;将所有维度的输入与其权重相乘再相加,输出结果;最后根据输出优劣性,逐步调整权重,直到输出最优。此时这些输入权重,就对应了要学习的输入输出关系。使用这些权重,就可以用来预测新的输入的优劣了。这种方法看似简单,但工程师可以设计多层网络,每一层的输出又作为下一层的输入,因此可以做很复杂的计算。学习的结果是个很高维度的权重向量,往往被看做的黑箱,虽然能给出优化的结果,但其过程人类很难解读。




由于近年计算成本迅速下降,人工神经网络获得高速发展,人们开始探索很多层的神经网络,即深层学习(Deep Learning)。这些深层神经网络,每层都将原始信息进行一次加工,所以可以进行高度抽象的信息加工。不同问题需要不同的中间信息处理步骤。当面临一个未知问题,如果我们不知道每一步信息怎么加工,就不知道每一层设置多少个节点,以及网络需要多少层。特定的问题,往往需要特定的网络结构来解决。什么样的问题可以用什么网络结构来解决,也就是深度学习领域研究的主要问题之一。


聪明的读者会问,那我们能不能看看人脑怎么一步步加工信息,来设计深度学习网络的结构?这个问题,其实也就切中了AlphaGo突破的关键。AlphaGo里用来实现“棋感”的核心网络架构,是深度卷积网络(Convolutional Neural Network, CNN )。这个架构,模拟哺乳动物视觉系统中的信息处理模式。它把图像中的信息,从局部到全局,由浅到深,层层加工,每层都增加一次空间上的抽象和粗粒化(Corse Graining)。每个空间尺度的信息,都在网络中有代表,最后网络用前馈(feed forward)结构,让计算结果同时考虑每一空间层级的信息。AlphaGo用这个网络架构,来模拟人类棋手同时照顾局部和全局的能力。




基于这个“棋感”的核心,AlphaGo加入了更多模拟人类棋手的组分。首先通过棋谱,学习基本招数,这是专家监督学习(Supervised learning,SL);然后通过自奕来学习不同策略的优略,这是强化学习(reinforced learning, RL);通过这两种学习,来训练态势评估。大家是不是发现和人类棋手的学习过程也有相似之处?大家如果细读AlphaGo的论文,就会发现其中提到,如果分离代表人类招数的SL网络,和代表机器自奕的RL网络,让它们对垒,人类招数会胜出。也就是说,人类专家棋手通过多年积累的知识,是没有被机器自奕的随机树搜索(Monte Carlo Tree Search)所超出的。


看完了以上对AlphaGo所用技术的快速简介,我们也可以评估一下AlphaGo智能的来源。代表它思维模式的网络架构,来自于图像处理领域对动物视觉神经系统的类比,以及多年对CNN的研究发展。它的学习策略,平行对人类棋手培养和学习方式的模拟。它走棋的基本招数和棋感,则来自于以棋谱为形式,围棋界多年的探索和积累。AlphaGo的成功,有赖于深度学习领域,成功地吸取了脑科学研究成果和人类围棋知识,配以机器的自动化学习和大规模计算。恐怕这并不是机器学会了围棋,而是工程师以机器为脑,掌握了围棋的奥妙吧。AlphaGo在Nature期刊上论文的标题也正指出这一点:使用深度神经网络和决策树搜索掌握围棋 (Mastering the game of Go with deep neural networks and tree search)。



围棋与人类智能


那么擅长棋类否象征着高智商?认知学家实验证明,人类智能在不同认知任务上的表现是高度相关的,因此假定人类具有通用智能(General Intelligence)。人与人之间通用智能的高下,也许还可以用棋类水平来衡量;但我们能否外推到机器智能?如果不了解AlphaGo的原理,用人类的通用智能来类比AlphaGo,是一种人类中心主义的马虎推理。我们了解了AlphaGo的核心技术,在人脑中找到对应,就可以判断AlphaGo所具有的智能是否是通用智能。


从前篇我们看到,AlphaGo和其他现代深度学习围棋程序最主要的智能,在于用CNN来学习来的“棋感"。而人类的“棋感”则来源于人脑中内禀的二维模式匹配能力。我们看云能看出各种动物和我们熟悉的形状,其实就在进行这样的模式匹配。无论云或远或近,是云的局部特征,还是一大片云的整体布局,我们都能匹配出这些形状来,正类似于CNN所实现的各个大小层级都考虑的思维模式。只不过动物视觉的这种反应,是不需要经过意识的。如果一个物体在我们视野里飞快出现,无论大小远近,我们都会立即反应,而不需要经过意识控制视觉聚焦在该物体上。这里可见,AlphaGo所模拟的,其实是人脑下意识中内禀的模式匹配功能,并不包括人类所有的认知功能。


人类模式匹配的巅峰是脸的识别。人的视觉皮层有专门部分处理脸的信息。有一种脑残疾,叫做“脸盲症”(Prosopagnosia)。患者因为各种原因损伤了大脑脸部处理的部分,虽然依旧可以看到一切图像,甚至脸上五官,却无法分辨不同脸之间的区别。他们无法从脸上读出感情,甚至不能识别亲人,而只能通过其他信息推测出对方的身份。当我们从各种自然景观中看到人脸,其实也是脑部的这一块在工作。动物智能,终究是生物进化的产物,是进化过程中对环境的适应。一个动物要在复杂的环境,社会,技术环境下生存,就需要一定的认知能力,来解决一些生存所须的问题。人之所以具有对脸部尤其敏感,是因为人是社会动物,脸部带来的情感和社会信息对我们生存繁衍非常重要。

所以人类智能,并不是一个万能计算机,而是对环境的适应罢了。它也是有设计原则,目标和组成成分的。人们研发人工智能,是希望用机器来模拟人类智能的不同功能,代替人类完成不同的认知任务。计算机早已在计算,高速信息收集和存储,策略规划等领域超越人脑。现代图像处理软件和AlphaGo一样,代表的是在模式匹配领域上机器的水平提升。IBM的Watson则代表着自然语言处理和语义处理的最高水平。可是这些认知功能的集合,我们暂时称为工具理性,是否就是人类智能的全部?



人类智能在进化过程中适应的游戏,并不是围棋或者国际象棋,或者有任何明确目标的游戏,而是人生。人类适应人生,不止需要认知和解题,更需要求生欲,创造力,好奇心,娱乐,和对现状的不满。许多相信科学主义的现代人,往往把后面这些非工具理性的思维过程,归结于情感与激情,恨不得去其而后快。殊不知,工具理性和人工智能一样,是需要外界赋予其目标和价值,正来源于情感与激情。如果只有工具理性,而没有其它的智能,同样不能适应人生。即便是人类智能的巅峰,现代科学,也不是工具理性的产物。虽然科学起源不是本文话题,但现代科学哲学的普遍观点是,科学来源于人类探索未知事物的内在动力和对自身智能局限性的批判,高超的工具理性,只不过发展复杂科学理论的助推器罢了。



围棋其实也是生物和社会进化的产物。人们用围棋这样的智力游戏来推测对方的智能程度,实际上是对对方大脑健康程度的快速检验,其目的并非围棋本身。之所以大家把棋类视为智能的挑战,和奥林匹克一样,来源于我们对更强的自我的渴望。一个棋手,能从小就投入毕生精力,致力于一个没有生产价值的游戏,表面上看来也并非理性;这种选择可能来源于社会分工的细化,和统治者对自己管辖社会的骄傲和炫耀。棋手之于社会,就像鹿角之于麋鹿,看似无用,却显示了主体的健康。人类设计出围棋程序,其实也是这种渴望的延伸罢了。人类对机器输掉围棋,就像骏马输给汽车,马夫和粉丝也许会痛心疾首,社会却不再回头。




结语


人工智能的发展,实际上是人类对自身思维过程的探索,以及这种探索的工程应用。人工智能的一步步成果,代表着人类自我理解的进步。

人工智能未来是否会取代人类?我的答案明确为否。在我看来,未来的趋势是人机协作。在这样的协作里,机器总是工具。想知道为什么,以及我对人工智能未来发展的看法,大家只能静待续作了。


关注混沌巡洋舰


欢迎加小编铁哥微信562763765

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存