【专家观点】应行仁:智能的进化与博弈
本文转自杨静lillian(lillian_yang_1111),原载《中国计算机学会通讯》第8期,作者: 应行仁
【静点评】在第五届智能产业高峰论坛会后的小范围研讨中,中科院计算所上海分所的孔华威老师提出一个观点,美国在学术研究中注重原发创新,因此经常涌现重大突破,引领领域革命。中国计算机学会通讯第8期,李国杰院士就深度学习和类脑计算这两个热门议题做了点评。他回顾了人工智能发展历史上的一些浪潮,有从盲目乐观到期望落空的规律,也对深度学习的黑盒子现象提出了系统理论支撑的期待。
而同期杂志中美国应行仁博士对人工智能的发展演进史从独特视角重新做了梳理,并对人工智能的未来进行了有深度的哲学思辨——深度学习的黑盒子和机器智能也许能引导人类思维模式的转变。他提出现在大数据深度学习的智能,已深植在联结主义模式识别和分布式计算的方向上。人工智能在大数据时代正从理性科学方法转向直接从数据中在线学习、即时反应的“感性”方法。
我们对世界的认知一直摇摆在感性和理性之间。艺术与科学的不同,传统思维和现代文化的冲突,人文主义和逻辑思考的矛盾,都反映着对“智慧”理解上的博弈。即使在人工智能研究的几十年发展史上,也是如此。
智能的进化
在今日大数据热潮中,重新焕发青春的神经网络、模式识别、机器学习和人工智能都始于20世纪50年代。1957年美国海军研究室弗兰克·罗森布拉特(Frank Rosenblatt)提出了一种模拟神经元感知、有识别智能的数学模型——感知器(Perceptron)。这个能够在线学习、具有图像识别功能的原型在计算机模拟试验后,有了硬件实现——“Mark 1 Perceptron”(包括400个光学传感器,用变阻器作为电导的权重,被随机连接到一组“神经元”)。每个神经元电路对应于一个视觉的判断,神经元汇合传感来的电流,以是否超过域值输出来进行逻辑判断。该感知器可以通过样本来学习,在训练中根据误差的反馈,用马达调节变阻器来改变神经元中联接的权重。这是一个只有输入输出、无隐含层的人工神经元网络。该网络有n个传感器的输入,每个神经元都是通过在数学上实现一个n维空间的超平面来区分样本点的模型。其学习的过程是用迭代的算法调节这个超平面的参数,使得它对样本区分的误差最小。这实际上也是一种统计分类,其收敛的算法成为模式识别中线性分类法的基础。这也是认知、心理和智能研究上联结主义的开端。
1958年,在由美国海军组织的发布会上,罗森布拉特公布了此项研究成果。这个在当时还是雏形的人工智能社区引发了人们的热烈讨论和广泛联想。《纽约时报》报道说:“感知器将会是能够行走、会交谈、有视觉、能写作、自我繁殖、感知自身存在的电脑胚胎。”这种智能基于感知和联想,可以对输入的数据进行学习分类和类比判断,是一种模拟动物本能和应用经验的方式。
在随后的年代里,人们很快发现了它的局限性。对于许多模式,感知器并不能通过训练来分辨。比如,在二维平面里的一、三象限上同属一类的点与二、四象限上属另一类的点无法用一条直线划分,这意味着感知器不能识别异或逻辑(XOR)的模式。研究的热情在失望中逐渐消退。1969年,当时人工智能界的领军人物马文·明斯基(Marvin Minsky)和西蒙·派珀特(Seymour Papert)在《感知器》(Perceptrons)一书中总结道:感知器神经网络只能区分线性可分的模式,它甚至不能学习简单的异或逻辑。尽管这对于多层网络来说并非如此,其后也有人发表了关于多层网络的异或逻辑实现的研究,但由于人们已被新的人工智能研究方向所吸引,使得感知器已成昨日黄花,因此大家都认为明斯基权威的论断终结了人工神经元网络的前途。这一方向的研究不幸停滞了十几年,人工智能研究由此转入用逻辑的方法来搜索推理知识的轨道。
正当人们对感知器失望之时,费根鲍姆(Feigenbaum)的DENDRAL专家系统和指导性论文出现了,对智能的模拟采用了一种与以往完全不同的思路。它根据给定的有机化合物分子式和质谱图数据,在保存了化学和质谱仪知识的数据库中,利用逻辑推理的方法,从几千种可能的组合中挑选出正确的分子结构。这是一个能产生高端实用价值的计算机新用法。人们憬然有悟,为什么我们不参考人类理性思考的方式,直接从成熟的知识系统中用逻辑来猜测搜索求解?经过几百年发展而来的科学知识是一个巨大的宝藏,科学利用因果关系构造出一个可以理解的世界模型,以此发现许多规律。作为站在智慧高端的人类,我们不必再模仿生物的低级智能,仅须模仿人类的理性,以谓词逻辑进行运算和启发式搜寻,就可拥有高级的智慧。如同机械放大了人力,我们可以用计算机来提高推理能力。这个基于科学推理和知识系统的计算主义智能研究路线使得专家系统在二十世纪七八十年代成为人工智能的代名词。人们相信,实现具有人类智慧的机器只是一个工程问题。1981年,日本投入大量资金,雄心勃勃地开始了第五代计算机的研究。然而在长达十几年的专家系统探索中,人们认识到有两个根本问题无法绕过。一是交互问题,专家系统只能模拟人类深思熟虑的理性。对于机器人来说最需要的是感知、互动,而不是人类最无趣的抽象思维技能。二是规模扩展问题,想象中无限美好的前景,只限于较窄一类问题的专家咨询,或小规模游戏问题的演示;将证明过的原理应用于实践中时,各种复杂因素的组合需要巨大的计算量,对比人类瞬间都能按直觉做出的判断(例如识别人脸,穿过有家具的房间)等,这些对计算机来讲则十分困难。80年代,人工智能的主流研究虽然有一些商业应用,但思想上沉闷乏味,最终进入冬天。
科学研究的激情犹如新颖时装的热潮,各种不同的思路总要等到主流新奇穷尽、精彩衰竭之后才会引人注目。1982年,美国加州理工学院物理学家霍普菲尔德(J. J. Hopfield),在带有隐含层的神经网络上,用反向传播(Back Propagation, BP)算法完成了异或逻辑的学习。他对学习算法收敛性的物理解释直观易懂,再次掀起了联结主义智能的热潮。其实多层神经网络能够实现异或逻辑,早在70年代就有研究论文。1974年保罗·韦伯司(Paul Werbos)给出了如何训练一般网络的BP学习算法,当时却无人重视。直到80年代,BP算法才被戴维·鲁姆哈特(David Rumelhart)、杰弗里·欣顿(Geoffrey Hinton)、罗纳德·威廉姆斯(Ronald Williams)、戴维·帕克(David Parker)和雅恩·乐昆(Yann LeCun)重新发现。
单层的感知器只能辨识线性可分的模式。而具有隐含层(多层)的神经网络能够识别所有的逻辑模式,具有简单链式法则的BP算法,为其奠定了学习算法的基础。经此突破后,由于语音和手写体字识别的市场需求以及硬件技术的成熟,到了90年代,对人类智能模仿的研究再次回到以模式识别为主的道路上。虽然BP算法在理论上适用于任意多层的神经网络,但其误差传播的梯度会随着层数的增加而扩散,易使非凸目标函数陷入局部稳定平衡点而无法提高效益,或“死记硬背”只记住样本而不会类推的局面。所以,单纯的BP算法只对浅层的网络起到作用。为此,有许多研究集中在对多层神经网络学习算法的改进上,出现了各种算法,如统计热力学的模拟退火技术,用波耳兹曼模型说明趋于全局稳定的学习算法,模拟进化过程能迅速收敛的遗传算法等。但是自80年代起的20年间,各种效率较高的模式识别模型(如向量机、Boosting等)也不过是与浅层神经网络相似的数学模型。
浅层的神经网络仅仅是具有简单分类能力的低阶智能。模式识别在技术上是利用特征进行分类的,通常依赖于人工选择辨识的特征。这对于模糊特征等复杂的情况具有极大的局限性。而人类的大脑甚至动物的大脑都具有深层的网络结构,低层对感知信号进行特征的抽象,高层对这些特征进行归纳,并做进一步抽象,逐层辨识抽象,从而能够分析复杂情况。学习的关键是如何将深层的潜力变成功能。在2006年欣顿(Hinton)等人发表深度学习文章之前,对深层神经网络的学习都未能在理论上有所突破。
如果把每层神经元的映射看成对输入属性的抽象,那么采用某种反馈奖励机制进行预先学习,就有可能在样本中自动地聚合出一些属性的抽象,而合适的抽象又能在后续样本训练中被强化,作为下一层模式识别所需要的特征。这种预先学习是无监督学习,类似于人的智商悟性;有目标训练的学习称为监督学习,类似于上课学习。欣顿的创意是基于深信度网(Deep Belief Networks, DBN)的深度学习,在深层网络中逐层采用无监督的预先学习和随后的监督学习,从而提高学习效率。该方法在语音识别上获得了很大的成功。另一方面,动物大脑在出生之始并非是同质通用的构造,其低层如视神经、听觉神经都是由遗传而得的分化结构。早在20世纪60年代休布尔(Hubel)和威赛尔(Wiesel)就发现猫脑皮层中独特的网络结构可以有效降低学习的复杂性,于是人们提出了卷积神经网络(Convolutional Neural Networks, CNN)。具有局部联接和参数共享的卷积数学模型含有较少的参数和位移以及缩放扭曲等不变性,作为神经网络的低层部分可以很容易地学习二维图像特征提取,用于直接输入原始图像的监督训练。这种具有“先天”视觉低层结构的人工大脑很快就在图像识别领域大放异彩。
智能的博弈
2014年,脸谱公司采用具有9层神经网络的深度学习方法,对人脸的识别率达到了97.25%。而在语音识别系统(如iPad的Siri)中,各种代替人的语音辨识技术已被广泛应用。机器在模拟视觉和听觉的辨识能力上已经非常接近人类了。在四五十年前的专家系统时代,人们曾好奇地问,计算机会比人类更聪明吗?智能机器人会反叛吗?有知识的人那时都很淡定:机器是在人类制定的规则中行事,其智慧是在人赋予的知识内进行逻辑推理,可以规定机器人三个定律,第一法则是机器人不得伤害人类。但如今深度学习的联结主义机器完全在模仿人脑的功能,虽然现在还需要我们帮助构建先天的联接拓扑结构和挑选训练的内容,但未来很可能有互联网中自学的机器。令人担忧的是,这种联结主义机器的大脑是个黑箱,它是怎么想的,知道些什么,为什么会这样想,我们都无法了解和控制。由亿万无规则权重组成的复杂系统,即使拆开硬件、分析数据,也无济于事。
有很多生物的大脑在某些智能方面超越了人类。比如在辨识方面,狗的鼻子远比人灵敏,很多动物在地震前都能有所察觉,凶猛动物在判断速度、调整机体预测反应方面都胜过人类,我们对此欣赏并不担忧。而对于一些人造的机器设备,其力量、速度、精确性和计算能力,是人类不可企及的,我们也能泰然处之,因为在人类的智慧面前,它们都是可控的。
《圣经》里说,全能的上帝创造了人类,人类无忧无虑、无知无识地生活在伊甸园里,直至受到蛇的诱惑,吃了智慧果后知善恶,自己能够做判断,企图拥有不受上帝控制的能力,引起了造物主的震怒,便成为人的原罪。今天的人类凭借着智慧发展了科技,也扮演着上帝的角色,建造伊甸园,圈养宠物,创造机器。当人造的机器拥有智慧,也能独立判断,不再对人类唯命是从时,我们能用《圣经》教化它们吗?西方人的忧虑来自其文化深处信念的自省。人因智慧成为万物之灵,替代了上帝主宰着世界。不过,当机器的智力超越人类时,我们将如何自处?有人为此大声疾呼:要禁止人工智能的研究,它终将会奴役人类!
但这只是一元神文化孕育出的创造与驯服的思想模式。也许没有全能全知的神,人类也从未真正统治过世界。在深思人际及环境相处的中国传统文化里,着眼于博弈胜负之技只是工其“术”,而知博弈前景则要悟其“道”。既然忧心人与机器智能的博弈,那就此深思看未来吧。
智能作为动物的一种本能,确是为自然竞争而进化来的。模式识别为生存博弈之所需,识别环境分辨敌我和伪装欺瞒都是竞争中的智能,在生物识别和欺瞒的博弈中双方都是以最小的代价争取最大的收益。在机器识别技术与客户欺瞒智力的博弈中,双方也依对手而采取具有恰当代价的策略。所以技术的升级是在博弈中交互变化的,漏洞总是有的,即所谓“道高一尺,魔高一丈”。
机器能否识别任何模式,发现事物的规律?其实这也是人类科研的梦想。这可能吗?
被感知的只是事物的部分属性,所以“识别”也只能是部分的确定,而模仿总是可能的。在识别和欺瞒的对抗竞争中,智能的升级没有止境,这意味着识别不总是可能的。事物的规律是行为的模式。从博弈的观点出发,博弈的结果由局中各方的策略而定,没有一方能单独决定结果。无论是机器还是人,一旦有了自主的意志,对方就无法确定其行为,也就无法把握其规律和结果。博弈总是以不对称的优势取胜,所以识别模式和掌握规律总是有限度的和暂时的。
能否通过学习逐渐逼近被识别的模式?这取决于它所在的博弈局势。例如在“少数者胜”的局势中,获胜的关键在于与众不同。两条平行车道中哪一条更挤?若有确定的答案,局中的其他智者都据此行动,则原来不挤的车道就会变得拥挤,因此这答案不再是对的。对于许多博弈局势就是没有不变的取胜模式。
竞争中的博弈需要的不仅仅是对抗,还有合作。合作往往是双赢的优势策略。识别和理性也是为合作而生的智能。对于“从众的博弈”,即随大流能形成合作互利的局势,必然会出现“路径依赖”的现象。最早被传播的论断、认知或应用即使不是最合适的,最终也会成为公认的正确模式。山间的小路是这样走出来的,网络语言是这样流行起来的,键盘的字母分布也是这样成为标准的。这种局势对学习最有利。实际上,有效辨识大部分事物的模式、语言的形成、人类的交流以及学习和知识体系的成功,都是基于这类博弈局势上的学习效率。
在充斥着“囚徒困境”的自然竞争博弈中,因合作走出困境的未灭绝的生物和人类都不是因智力而取胜的。人与智能机器的未来是陷入征服的恶斗,还是携手合作取决于我们对机器的心态和文化传承。
互联网海量的数据、强大的并行计算能力、大量商机的即时应用需求,呼唤着大数据时代的到来,推动着工程师寻找新技术,技术也渴望智能研究的支持。传统科学那种统计数据、总结规律、逻辑分析等,先了解“为什么”,再得出“是什么”的理性方法,已经不敷这多变、复杂、即时的应用了。市场需要的是类似于动物的本能,那种基于经验即时反应的智能,现在大数据深度学习的智能,已深植在联结主义模式识别和分布式计算的方向上。人工智能在大数据时代正从理性科学方法转向直接从数据中在线学习、即时反应的“感性”方法。这值得我们反思。
客观世界并不是由逻辑驱动或构造的,它只因生物的智能而被感知。对智能而言,逻辑不过是一种对相同含义不同语句表达等价性进行辨识的模式,生物对事物间的感知经验只有关联性,而因果性则是建立在逻辑基础上的推理模式。它被传播和学习后,成为现在人类理性认知结构的基础,对世界的认识就变成逻辑推理的计算。科学是建立在利用因果关系结构模式对世界进行描绘的图谱上的,而真实的世界不一定都能很好地纳入这个模式中。实际上,我们对音乐的感受、艺术的理解、情感的交流、人性的共鸣同样是一种智能的表现,同样是在学习中进步,同样也在生存竞争中扮演着重要的角色。而这些不能纳入理性模式的东西,过去都被人们忽略了。现在,机器智能的进化也许也正引导这人类思维模式的改变。■
应行仁:美国华盛顿大学系统科学与数学博士。主要研究方向为智能控制、博弈理论和复杂系统。
其他主题系列陆续整理中,敬请期待……