侯世达:让机器学习思考的人
利维坦按:本文较长,如果你是对人工智能以及人类大脑思考方式感兴趣的人,请耐心看完,或许会对你有所帮助。
文/James Somers
原文/www.theatlantic.com/magazine/archive/2013/11/the-man-who-would-teach-machines-to-think/309529/
译文原载于《新知》杂志
图源:GREG RUFFING
侯世达(Douglas Hofstadter)是《哥德尔、艾舍尔、巴赫——集异璧之大成》的作者,并以此书获得普利策奖。他认为我们已经忘记了“人工智能”真正的含义。
“这其实取决于你认为人工智能指的是什么。”侯世达在印第安纳布鲁明顿的杂货店里挑选沙拉配料。“如果有人认为人工智能是指尝试理解大脑思维,或者制造一些类似人类的东西,他们大概会说人工智能是有史以来唯一有价值的事情。”
侯世达的语气里带有一种漫不经心的刻意,因为对他而言,现代人工智能领域最激动人心的项目,那些仿佛是科幻小说里才会出现的产品——例如能够参加益智竞赛的IBM超级电脑沃森,或者iPhone语音助手Siri——其实和人工智能都没什么关系。在过去的三十年中,侯世达和他的学生都待在印第安纳大学西北边的一个老房子里,试着补上这个研究缺口:通过编写可以自己思考的程序来探索人类思考的方式。
他们的假设非常简单:大脑是一个非同寻常的软件,要明白这个软件如何运行,最好的方法就是亲自写一遍。计算机非常灵活,足以模拟大脑奇怪复杂的思维,但它只听命于精确的指示。如果他们的努力有所回报,简直是一石二鸟:我们终于可以明白自己的思维机制——也可以制造懂得思考的机器了。
侯世达常说,这个改变了他人生的想法是在一次旅途中出现的。当时他是俄勒冈大学粒子物理专业的博士生,博士论文写得非常不顺利,感到“非常迷茫”,于是在1972年的夏天,他收拾行囊,钻进了他那辆叫“银色快手”的汽车,一路向东,横穿北美大陆。
他每晚都在不同的地方搭帐篷,打着手电筒看书。他可以自由地思考他想思考的一切:他选择了思考“思考”本身。14岁那年,他最小的妹妹茉莉“因为大脑有严重障碍”,无法理解语言(她神经系统的这种状况应该是从出生就存在的,但从未被确诊过)。从那之后,他就默默着迷于大脑与事物之间的关系。心理学之父威廉姆·詹姆斯(William James)在1890年时曾将思考形容为“世界上最神秘的事物”——意识怎么会是有实体的呢?那几磅重的灰质是如何决定我们的思维和自我的呢?
数学家、逻辑学家、哲学家哥德尔(1906-1978)。图源:Encyclopedia Britannica
驾驶着他的1956年福特水星四处游荡时,侯世达觉得自己找到了答案——答案就在一个数学证明的核心里。1931年,出生于奥地利的逻辑学家库尔特·哥德尔(Kurt Gödel)提出了一个著名的理论,论证了数学论述不仅可以研究数字,还可以研究这个论述本身。侯世达想说的是,意识也是通过类似的“交叉反馈环”所形成的。有一天下午,他坐了下来,在给朋友的信中写下了自己的想法。但写了三十页纸之后,他决定先不寄信,而是让这些想法在脑海中继续酝酿。七年之后,这些想法发展成了一部2.9磅重,777页厚的著作——《哥德尔、艾舍尔、巴赫——集异璧之大成》。这部处女作也为三十五岁的侯世达赢得了1980年的普利策非虚构类作品奖。
图源:Evolving Lens Bookseller
这本书又叫《GEB》,在当时引起了很大的轰动。《科学美国人》的知名专栏作家马丁·加德纳(Martin Gardner)在1979年7月刊中写了一篇热情洋溢的书评,“每隔几十年,”加德纳在文章的开头如此写道,“就会有一个名不见经传的作者带来一本深刻、清晰、丰富、机智、优美又独特的书,立刻得到文学界的认可。”约翰·霍兰德(John Holland)是第一位获得计算机科学博士学位的美国人,他回忆说,“当时我周围的人都认为这是一部了不起的著作。”
《GEB》在当时被人工智能界奉为圣经。侯世达认为计算机程序不仅有能力解决问题,而且还可以很有创造力,他希望可以探索“人类大脑如电脑软件般的秘密构造”,而他的解读和蓝图也为人工智能的研究吸引了整整一代充满热忱的学生。然而,就在人工智能的研究方向发生改变时,侯世达却没有跟着变,他几乎消失了。
《GEB》的问世恰好赶上人工智能历史的拐点。这门学科综合了计算机科学、认知科学、神经系统科学和心理学等多个领域,但在上世纪八十年代初,它正面临资助紧缩的问题:美国对于长期“基础科学”的资金投入越来越少,重心都转移到了更具实用价值的领域。人工智能因其“雄心勃勃”而名声不好。回到1956年人工智能的起步时期,科学家们瞪大眼睛夸夸其谈的情景很常见。当年的达特矛斯会议上,组织者们——包括发明了“人工智能”这个词的约翰·麦卡锡(John McCarthy)——宣布说,如果一群精心挑选出来的科学家共同努力一个夏天,就可以取得很大进展,制造出拥有以下一种或多种能力的机器:使用语言的能力;形成概念的能力;解决目前只能由人类解决的问题的能力;自我提升的能力。麦卡锡后来回忆起他们失败的原因,说“人工智能比我们想象的要难”。
随着冷战时期的压力日渐增加,人工智能研究的主要经费来源——国防部的高级研究计划局(ARPA)——缩减了开支。1969年,国会通过了《曼斯菲尔德修正案》,要求国防部只能支持“与军事运作有直接和明显关系的”项目。到1972年,高级研究计划局变成了国防部高级研究计划局(DARPA),反映出对军事相关项目的重视。到了七十年代中期,研究计划局也在反省:我们在这十年间花了五千万美元支持的研究对国防工作到底有什么作用?
对于阿兰·图灵(Alan Turing)的著名问题——“机器可以思考吗?”,人工智能学界一直试图给出肯定的答案。到了八十年代初期,迫切想要交出一份答卷的人工智能研究终于开始成熟了——发展出了以应用为主的软件工程子领域。越来越多的研究都是为了短期目标,研究人员在做研发的时候脑海中往往已经有了明确的买家。对军方而言,最受欢迎的项目包括“命令和控制”系统,比如战斗机上的飞行导航,以及在航拍时能自动识别道路、桥梁、坦克和发射井等的程序。在民用领域,最受欢迎的是“专家系统”(编者注:一种在特定领域内具有专家水平解决问题能力的程序系统,能有效地运用专家多年积累的有效经验和专业知识,通过模拟专家的思维过程,解决需要专家才能解决的问题),例如可以帮助设计师选择打地基的材料的“桩柱选择系统”,还有ACE专家系统(Automated Cable Expertise),可以对电话电报网络故障进行检修并推荐适当的策略。
《GEB》一书中,侯世达呼吁人工智能研究不要执着于如何让机器聪明地解决人类的问题,而应更多关注对人类思想的理解——这显然带不来什么收益,所以就被抛弃了。他的明星光环也很快消失了。当时的主流迎来了新的目标:让机器可以完成各种各样的工作,而罔顾精神和心理上是否合理。
图源:Public Radio International
以IBM的超级计算机深蓝为例,它虽然击败了国际象棋大师加里·卡斯帕罗夫(Garry Kasparov),却是以蛮力取胜。每走一步之前,它都会先考虑对手下一步会怎么走,再决定如何应对,至少考虑到六步以上。因为计算功能极为强大(深蓝在一秒内可以计算出3.3亿种走法的得分,而卡斯帕罗夫在下决定之前只能算出其中几十种),它能在极短时间内计算和评估每一种走法的得分,然后按最高分的那种走法走就行了。
侯世达想问的是:为什么要做毫无胜算的事?他说,“深蓝下棋很厉害——又怎样呢?你能从中了解我们自己是怎么下棋的吗?你能从中知道卡斯帕罗夫是如何谋划和理解棋局的吗?”人工智能的任何一个分支领域如果不尝试去回答这样的问题——无论看起来成就有多大——在他看来都是走入了误区。“对于我这样一个刚刚起步的人工智能研究者而言,”他说,“显然应该远离这种旁门左道。人们会把一些看起来很厉害的程序当作人工智能,但我知道它们和智能一点关系都没有,我完全不想和这种研究扯上关系。而且我也不理解为什么那么多人不这么想。”
人工智能产业在八十年代初价值区区数百万美元,到了八十年代末已经涨到了数十亿美元,或许这能够回答侯世达的困惑。(1997年深蓝获胜之后,IBM的市值上涨了一百八十亿美元。)人工智能作为一个工程学科越是古板,取得的成就却越大。今天,技术正处于黄金时代,却与思想几乎无关。人工智能渗入重工业、交通和金融等多个领域。许多Google的核心功能都是由人工智能驱动的,还有Netflix的电影推荐,IBM的沃森人工智能系统,苹果的人工智能助理Siri,无人机以及自动驾驶汽车等。
“当莱特兄弟和其他人停止模仿鸟类,开始学习空气动力学时,就是人类飞天梦实现的开端。”斯图亚特·罗素(Stuart Russell)和彼得·诺维格(Peter Norvig)在他们所著的教材《人工智能——一种现代的方法》中是这么写的。人工智能也是在放弃了模仿人类之后才渐入佳境的。既然飞机不需要扇翅膀,计算机为什么要学会思考?
这个观点很有力。但你得仔细想想我们真正想要的是什么:一个能明白你在搜索时到底想搜什么的Google。罗素是伯克利大学的计算机科学教授,他对我说,“网上所有搜索引擎公司的市值加起来有多少?大概四五千亿美元吧。而可以真正提取并理解所有搜索信息的搜索引擎的价值可以达到这个数字的十倍。”
图源:Gifer
这就是那个价值亿万美元的问题:目前支撑人工智能领域的研究方向——不模仿大脑,而是以大数据和编程为基础——可以带我们到理想的彼岸吗?如果连自己是如何思考的都不知道,你要如何制造一个能够理解你的搜索引擎?或许,正如罗素和诺维格在他们教科书的最后一章中非常委婉地承认的,人工智能就像是一个想通过爬树爬到月亮上的人,“在爬到树顶之前一路上确实取得了稳步进展。”
计算机至今还无法识别一个手写的A。事实上,这个任务对计算机来说太难了,所以才会有CAPTCHAs(全自动区分计算机和人类的图灵测试),也就是所谓的“验证码”,很多网站在注册之前经常要求你输入一串扭曲变形的字符。
在侯世达看来,这没什么值得惊讶的。他在1982年的论文中曾经论证,要想知道所有的A有什么共同特点,“需要理解思维范畴的流动本质。”而这,就是人类智慧的核心。
“认知就是识别,”他喜欢这么说。他认为“看作”(see as)是最关键的认知行为:你会把几条线看作“A”,把一块木头看作“一张桌子”,把一个会议看作“皇帝的新衣”般的场景,把朋友的撅嘴看作是“酸葡萄”心理的表现,把一个年轻人的穿衣风格看作“新潮”……这就是所谓的理解。但理解到底是怎么运作的呢?三十年来,侯世达和他的学生一直试图寻找答案,建立一个“思维基础机制的电脑模型”。
《表象与本质》原版书封。图源:Amazon.com
“每时每刻,”侯世达在新书《表象与本质》(与Emmanuel Sander合著)中写道,“我们都面临数不清的复杂交错的情形。”我们作为有机体想要生存下去的话,就必须时刻在这混乱中寻求秩序。侯世达很爱运用类比。他的新书封面是一系列不同字体的A,该书的主旨大意就是,“类比”是“思考的燃料和火焰”,也是日常精神生活中的面包和黄油。
“研究一下你们的谈话内容,”他说。“反复琢磨几遍,你会惊讶地发现,谈话就是制造类比的过程。”有人说了什么,让你想起了别的什么;你说了什么,让别人想起了其他什么——这就是对话,再直接不过,但类比的思维跳跃如此复杂,简直是一种计算的奇迹:你的大脑就是有办法透过不相关的表面信息直击要害,提取核心,然后从你的想法和经历的资料库中找到最相关的一个故事或者一句话来进行回应。他写道,“哦,没错,我也遇到过这样的事!”,这样的话背后就隐藏着人脑的全部奥秘。
《GEB》出版之后,侯世达就与人工智能分道扬镳了。今天,若你从书架上抽出《人工智能:一种现代的方法》,翻遍这本超过一千页的书,你也找不到侯世达的名字。同事们提及他的时候用的是过去时。新的粉丝翻到《GEB》的出版日期,发现作者居然还活着会觉得很惊讶。
按照侯世达的说法,当人工智能领域的所有人都在制造产品时,他和他的团队却在对核心问题进行抽丝剥茧的分析。他的哲学家朋友丹尼尔·丹尼特(Daniel Dennett)写道,“他们的分析很有耐心,很系统,很精彩”。“很少有人对人脑智能如何运作感兴趣,”侯世达说,“这正是我们感兴趣的——什么是思考?——我们一直都在探索这个问题的答案。”
“我的意思是,谁知道呢?”他说。“或许将来有人会说,这些事情侯世达早就说过,早就做过,只是我们现在才意识到。”
听起来很像是输家的自我宽慰。但面对这样一个人,你会忍不住想问一句:如果人工智能界最好的想法——侯世达所谓“真正的人工智能”——被丢弃在布鲁明顿的一个抽屉里泛黄,一切又将如何呢?
图源:Rod Searcey
侯世达的一生从一开始就注定与思考为伴。他成长于上世纪五十年代的斯坦福校园,旁边的社区就叫“教授屯”。父亲罗伯特(Robert)是核物理学家,是1961年诺贝尔物理学奖的获得者,母亲南希热衷于政治,是发育性残疾儿童的权益倡导者,同时也是阿格纽发展中心的道德委员会委员;妹妹茉莉在阿格纽发展中心生活了超过二十年。
南希长于社交,侯世达一家的客厅被改造成了知识精英们尽情谈天和跳舞的地方。知识的盛宴夜夜不断,小侯世达则尽情饕餮。他被父母朋友口中那些“最小的东西和最大的东西”给迷住了。(八岁的时候,他曾说,他的梦想是成为“一个零质量的中微子”。)他会在四点下午茶的时间去物理系闲逛。“就好像我是一个12岁的本科生一样。”他好奇心很重,学而不厌,也从来不觉得无聊——“是一个热爱思考的孩子”——而且他的学习强度非常大。不论过去还是现在,他总是纵情在知识中狂欢:他可以一天练习钢琴长达七个小时,他会突然决定背诵1200行的《叶普根尼·奥涅金》;他曾花好几周的时间用一台录音机教自己倒着讲话,这样录音倒播的时候就可以听到正常的英语;他会花好几个月浸泡在法语里,或者编写电脑程序来生成无意义的故事;他还会翻来覆去研究毕达哥拉斯定理的十几种证法……他每天都在探索这些事情,“没办法不去探索。脑海完全被这些想法占据了,完全着迷了”。
侯世达今年68岁,但身上还是带有一种彼得·潘式的纯真。他的一生大部分是在纸上、程序里还有自己的脑海中度过的。这样的人,即使老了大概也是与众不同的。他的灰发在后随意乱翘,看起来虚弱又无精打采,鼻子和上唇之间有一道长长的人中,就像圣诞怪杰一样。他的自矜和急切的热诚又是年轻人式的。他是那种会让所有晚宴客人都吃素食的素食主义者,也会敏感地纠正你的“性别主义用词”。“他的规矩很多,”与他相识59年的朋友彼得·琼斯(Peter Jones)解释说,“比如他特别讨厌有人说伙计们(you guys)。如果你要跟他说话,最好别用这个词。”
三十多年来,侯世达都在布鲁明顿的印第安纳大学当教授。去年九月他又结婚了,与妻子林宝芬(Baofen Lin)一起住在距离校园几个街区的一栋房子里。他与上一任妻子所生的两个孩子丹尼(Danny)和莫妮卡 (Monica)都已长大成人。尽管他和认知科学项目以及好几个系所都有紧密的联系——包括计算机科学、心理学和大脑科学、比较文学以及哲学——却没有正式的责任义务。“我认为我的工作是你能想象到最轻松的工作,”他告诉我,“我想做什么就做什么。”
他的大部分时间都消磨在书房里。书房是他房子顶层的两个房间,铺了地毯,有点挤,有点乱。很显然,他的整个精神生活就在这间书房里——整面墙都是书本、画作、笔记本和档案,他的思想像化石一样沉淀了下来,铺满了整个房间,很像是纪录片《强迫性囤积症患者》中的场景。在这里,他阅读,听音乐,学习,绘画,写书,回邮件(侯世达每天要花四个小时写邮件)。“对我而言,”他说,“写邮件和写信是一样的,一样正式,样精炼,一样认真……所有的邮件我都会不停地重写、重写、再重写。”
“我思考的任何事情都会变成我专业的一部分,”他说。与他合著《心我论》的丹尼尔·丹尼特解释说,“简单来说,侯世达是一位现象学家,工作中的现象学家,而且是史上最好的现象学家。”他会研究自己大脑内的现象——感觉和内在活动。丹尼特告诉我,“他比其他人都要在行的原因是他非常积极地想要提炼出一个理论,总结思维的形成方式。”
侯世达的后口袋里永远放着一根四色圆珠笔和一个小笔记本。他的书房旁边原本有一个浴室,现在也成了储物间,里面好几个书架上都堆满了这样的笔记本。他抽出了一本——五十年代末期时用过的一本。里面满满都是口误记录(speech error)。从少年时代至今,他已经发现了大约一万个口误案例,包括发音置换,比如将hypodermic needle(皮下注射的针)发成hypodeemic nerdle;还有荒唐的近音错误,比如把runs the gambit(经营策略)发成runs the gamut(全部展示);以及“谚语杂糅”,比如easy-go-lucky就是happy-go-lucky(无忧无虑)和easy-going(性情随和)的杂糅,诸如此类。里面一半以上的口误都是侯世达自己犯下的。他把笔记本里面的纸复印下来,剪好,保存在书房的档案柜或贴了标签的盒子里。
对侯世达而言,这些都是线索。“对于自己的下意识思维,谁说的话都不可靠,”他曾经这么写道,“所以广泛收集错误就非常重要。若只看一个错误,只能发现思维机制的一点规律;如果收集了大量错误,海量的规律加起来就可以让我们得到一个强大的证据,证明或者否定某种机制。”正确的语法没什么意思,它就像一个表演成功的魔术——效果很好,因为它模糊了人们的焦点,让人们看不到其中的奥秘。侯世达在寻找的是“兔耳朵和活板门的一角”。
美国哲学家、心理学家威廉姆·詹姆斯。图源:The Conversation
在这方面,他可谓是现代的威廉姆·詹姆斯。詹姆斯在1890年出版了《心理学原理》,以清晰的内省(他引入了意识流的概念)和利落的解释而被奉为经典。“我们的思考大部分都会永远消失,再也找不回来,”詹姆斯是这么写的,“心理学仅仅是把餐桌上掉下来的碎屑收集了起来。”就像侯世达,詹姆斯也乐于在餐桌下玩耍,愉快地检查着那些碎屑,并以此为生。差别就在于詹姆斯只能用肉眼检查,而侯世达则拥有类似显微镜的东西。
你可以不将飞机的发明归功于莱特兄弟在基蒂霍克的滑翔试飞,而归功于他们在自行车店里用废弃的金属和旧轮辐造出来的六英尺高的风洞。当他们的竞争者全力以赴地测试有关安装翅膀的想法时,莱特兄弟正在用极少的钱进行空气动力学的实验。他们的传记作者弗雷德·霍华德(Fred Howard)说这些实验是“在这么短时间内用这么少的材料、这么微薄的资金做出来的最关键、最有成果的航空学实验了” 。
在布鲁明顿北飞斯大街上有一栋旧房子,侯世达在那里主持流动性类比研究小组(Fluid Analogies Research Group,FARG)的活动。每年的经费是十万美元。房子布置得很温馨——在里面走一圈,你可能都注意不到食品储存室里放着的档案柜,客厅里嗡嗡作响的复印机,还有书架上贴着的图书馆式的标签(神经科学、数学、知觉)。但25年来,这个地方一直洋溢着激情,侯世达写道,“首先是探索创造力的秘密;然后揭开意识的面纱。”
计算机对于FARG的意义就如同风洞对于莱特兄弟的意义。人类大脑中稍纵即逝的无意识的混沌可以在计算机上慢播、回放、暂停、甚至编辑。在侯世达看来,这是人工智能的绝佳机会。可以有选择性地将一个程序的一些部分剥离,看看如果没有这些部分,会给程序带来什么样的变化;也可以改变一下参量,看看大脑运作是会加强还是减弱。如果电脑发生的变化让你惊讶——无论是变得特别有创造性或者特别蠢——你都知道具体是为什么。“我一直都觉得让人类彻底明白思维复杂度的唯一希望,”侯世达写道,“就是在电脑上建立思维过程模型,然后通过这些模型的失败来学习。”
这些程序都有同样的基础结构——组成和整体风格都源于侯世达在1982年写的一个程序Jumbo,它可以解决报纸上的填字游戏。(编者注:在这种游戏里,单词里字母的顺序被随机打乱,然后玩家要找到原来的单词。)
一个程序居然是用来完成报纸填字游戏的,你的第一反应可能是,未免太大材小用了吧?的确如此——我刚写了一个足以应付所有单词的程序,花了四分钟时间。我的程序是这样工作的:罗列几个字母的每一种排列组合方式,直到发现字典里存在的单词为止。
侯世达花了两年的时间来编写Jumbo:他的兴趣当然不在填字游戏,而是大脑在这个过程中是怎么运作的。他一直在观察自己的思维。“我可以感觉到字母在我的脑海里打转,”他告诉我,“它们跳来跳去,组合、分开、又再次组合。我没有操控它们,而是它们自己在排列组合。它们在努力自己做着什么。”
侯世达说,Jumbo的模型结构其实是模仿生物细胞内部的活动。字母的组合与分裂是在“酶”的作用下进行的。有的“酶”负责对字母进行重新排序(pang-loss变成pan-gloss或者lang-poss),有的则负责连接(g和h组成gh,jum和ble组成jumble),还有一些则负责拆分(ight被拆分成it和gh)。这种运算方式的独特之处就在于其流动性。侯世达又给出了一个类比:一大群蚂蚁正在森林中漫步,一小撮侦察兵先四处查探一番,然后向小组报告发现。它们的反馈可以有效地帮助蚁群找到食物。这样的蚁群是非常有活力的——踩死一小撮蚂蚁,其他的蚂蚁很快就会补上它们的位置。
图源:The Atlantic
《流动性理念和创造性类比:思维基本机制的电脑模式》(Fluid Concepts And Creative Analogies,编者注:这是美国亚马逊公司卖出的第一件商品)详细解释了程序所用的这种结构、逻辑和机制。读一读这本书,你会觉得,侯世达应该因为这本书而出名才对。《纽约时报》的作者曾在1995年的书评中写道,《流动性理念和创造性类比》的读者会怀疑印第安纳大学那个小组是否正在做一件惊天动地的事情。
但事实上,很少有人知道这本书或者书里提到的那些程序,连《GEB》的崇拜者们也大多不知道。可能是因为这些程序都太不实用了,看似琐碎,甚至幼稚,而且它们还没有哪件任务是完成得比人类要好的。
现代主流人工智能研究从上世纪九十年代初至今一直稳步前进,不断取得商业成功,这是谁都没有预料到的悠长春天,而此前的寒冬差点让整个行业消失。
由此,我们陷入了一个进退两难的窘境:一方面,我们只会写秩序井然的程序,就像训练有素、等级森严的军队一样,每一级的指挥官给下一级下达命令,现在的计算机程序也都是这样向子程序下达命令的。另一方面,我们想要的程序应该是有适应能力的,这样一来,层层下达命令的规则似乎是个错误的想法。侯世达曾经这么总结道,“人工智能的所有努力最终都是为了克服计算机的死板。”
八十年代末,主流的人工智能界已经没有研究经费,没有政治影响力,没有人参加研讨会,没有人发表论文,也没有研究见诸报端。当时最有前途的“专家系统”也面临坍塌的命运。他们的方法从根本上看来是错误的,比如机器翻译(人工智能长久以来的圣杯之一),把语言学家和翻译者关到小屋子里,将他们的专业知识转化为程序能够明白的规则。这种方法最终被证明是一条死胡同:没有哪一套规则可以涵盖一门语言。语言太庞大多变,遵循一条规则就必定会打破另一条规则。
如果要让机器翻译像商业公司一样存活下来——如果希望人工智能能够存活下来——就必须另辟蹊径。最好是,捷径。
事实上,人工智能的确幸存了下来。转机是从1988年开始的。当时IBM有一个项目叫Candide,一个机器翻译系统,研发人员从一开始就抛弃了当时流行的基于语言规则的方法,因为这种方法对机器的要求太高了——机器必须对语言的产生有极为深入的了解:要了解语义、语法和构词法,要了解单词是怎么拼成句子、句子如何组成段落,还要理解词汇只是通往意义的载体而已。
他们使用的,是一种叫“机器学习”的方法。他们的目标是要制造出一个装置,输入一个英语句子,就能吐出一个法语句子。已有的类似装置当然是人脑,但你又不想跟人脑在“复杂度”上较劲。所以你现在要做的,就是从一个最简单的机器开始,给它一个英语单词,它就会随机吐出法语单词。
想象一个箱子,上面有数以千计的旋钮。有的旋钮控制总体设定:输入一个英语单词平均应该吐出多少个法语单词?有的控制特殊设定:输入jump这个词,下一个词是shot的可能性有多大?问题是,仅仅只是摆弄这些旋钮,能让这个机器把英语转化为通顺的法语吗?
事实证明,可以。你需要做的就是输入一些已经知道法语翻译的英语句子。(比如说,Candide就用了220万组句子,大部分都来自加拿大议会辩论的双语文件。)一次只处理一组句子。先输入英语的部分,看看出来的法语句子是什么样的。如果与正确的翻译不同,说明机器还不够精确,需要微调按钮再次尝试。经过反复的输入、尝试、调整,你对这些旋钮会越来越熟悉,然后就可以给这些英语句子找到正确的法语翻译了。
上百万个句子之后,你的机器会变得越来越精确,即使输入一个你不知道正确法语翻译的句子,也能得到正确的结果。这种方法的美妙之处在于,你不需要编写精准的程序,也不需要弄清楚这些旋钮为什么要这样转或者那样转。
“机器学习”并非Candide的发明——事实上,早在六十年代,机器翻译尚在雏形期间,这个概念就被多次测试过了,只是一直没有成功,直到Candide问世。Candide的真正突破并不在于解决了什么根本性的问题,而在于它得到了充分的执行。正如Candide小组成员亚当·伯格(Adam Berger)在项目总结中所写,机器翻译是“公认的然语言加工中最难的任务之一,在人工智能领域也是如此,因为如果没有对材料的理解,准确的翻译几乎是不可能的”。像Candide这样简单直接的软件也可以解决翻译问题,说明有效的翻译机器并不需要理解词意——它需要的只是大量的双语文本。
Candide的方法,其实是转化问题本身——将一个复杂的,需抽丝剥茧方能解决的问题转化为一个累积足够多的例子就能搞定的问题。模仿大脑运作太难,Candide的方式却很简单,而且随着时间的流逝,问题似乎越来越简单了,尤其是到了八十年代末九十年代初,万维网出现了。
人工智能在九十年代的复苏并非巧合,而Google这个世界上最大的互联网公司成为“世界上最大的人工智能系统”也同样不是巧合。这是彼得·诺维格的原话,他是Google的研究主管,与斯图尔特·罗素合著了《人工智能:一个现代的方法》——诺维格说,现代的人工智能就是“数据、数据、数据”,而Google的数据比谁都多。
图源:Gifer
Google翻译是目前世界领先的机器翻译系统,使用的也是Candide的运算原则。乔什·埃斯特尔(Josh Estelle)是Google翻译的软件工程师,他解释说,“无论你用的是人工智能初级课程里学到的最简单的算法,或者学界早已抛弃了的算法,只要把数据从一万增加到一百亿,这些算法都能行得通。”
这种方式非常有效,即使Google翻译的大部分语种是团队成员不懂的,也照样可以正常工作。“这很划算,”埃斯特尔说,“与其雇佣母语人才,不如多请点工程师。”
这就是为什么机器学习会在人工智能界成为美妙的福音:不再需要“理解”,只要掌握好软件工程的基本知识就可以了。诺维格说,“在Google的发展过程中,这种理念越来越受欢迎。只要将程序的运行速度提高10%,每年就可以省下几百万美元的开销,所以赶紧做吧。怎么做呢?我们先研究数据,然后用机器学习或是数据统计的方法,做出更好的产品。”
Google也有一些项目是需要深入理解的,比如仿脑生物学的机器学习分支领域;知识图谱项目,可以将搜索关键词,例如“奥巴马”,直接映射到人物、地点事物。但十亿用户的需求迫使这家公司更多的舍弃“理解”,而选择“便捷”。Google翻译就是一个很好的例子,它为覆盖面、翻译速度以及工程上的便利所做的妥协,明眼人一目了然。尽管Google翻译使用的是人类智慧的成果,它本身却并没有智慧,就像巨大的罗塞塔石碑,刻满了无法辨认的象形文字。
图源:Dribbble
“制作沃森时,我们有没有坐下来试图模拟人类的认知方式?”戴夫·费鲁奇(Dave Ferrucci)是IBM沃森研究小组的负责人,他停顿了一下以表强调,“绝对没有。我们仅仅是试着做出一部可以在《危险边缘》(Jeopardy!一档益智竞赛节目)中获胜的机器。”
对于费鲁奇而言,“智慧”的定义很简单:即程序能完成的任务。“深蓝”是有智慧的,因为它击败了象棋大师加里·卡斯帕罗夫。沃森也是有智慧的,因为它击败了《危险边缘》最聪明的选手肯·詹宁斯(Ken Jennings)。“这就是人工智能,对吧?也就是说是非人类的智慧。你为什么要期望人工智能科学可以发展出人类的智能呢?”
费鲁奇对人脑电脑之间的差别看得很清楚。他喜欢说,沃森需要一整间屋子的处理器,外加二十吨重的空调设备;而它的对手们仅需要一个比鞋盒子还小的装备,靠一份金枪鱼三文治就能运行好几个小时。比赛结束之后,这个装置可以让他们站起来,聊几句,吃个面包,争论一番,跳个小舞,思考人生——而沃森却只能默默在屋里嗡嗡作响,又热又蠢死气沉沉。
“我们总是低估——五十年代时低估了人工智能,现在还是这样——这回是人脑。”费鲁奇说。
侯世达大概会想问一句:既然如此,为什么你不去研究一下呢?
“我对此的感觉很复杂,”去年我问费鲁奇这个问题的时候,他是这么说的,“作为一个个体,你能做的事情其实很有限。如果你致力于做某件事的话,一定会问自己这个问题:这是为了什么?我的答案是这样的,我对人脑内部运作很感兴趣,学习认知科学一定很有意思,我很喜欢读这方面的书,也很希望可以掌握这方面的知识”——他也认为侯世达的书非常有启发性——“但是,我能在这个方向取得什么成果吗?我真正想要做的,只是搭建一个可以切实做点事情的计算机系统。我不认为认知理论能带我快速抵达这个目标。”
彼得·诺维格的说法几乎和费鲁奇的一模一样,“我认为他是在努力攻克一个很难的难题,”他谈起侯世达时说,“但我还是更愿意去处理简单一点的问题。”
在这些回答里,你可以看到人工智能昔日的失败影响至今。对于本质问题的研究让人想起早期的难堪。对于声望的顾虑,尼尔斯·尼尔森(Nils Nilsson)在《人工智能》一书中写过,已经让一些人工智能研究者变得毫无用处了。
面对一个问题时,沃森能同时运行成千上万种算法寻找答案,然后把这些答案汇合,并算出对每一个答案的确信程度。图源:维基
与诺维格合著《人工智能:一种现代方法》的斯图尔特·罗素更加激进,“现在正在进行的一些项目都缺乏野心”,他告诉我,“在机器学习领域,八十年代的一大突破就是‘看,这是一些真实数据——我可以用程序来准确预测其余的数据',而现在的机器学习领域似乎把它当成唯一的任务了。”
被自己的成功所羁绊是很难察觉的。当机器的速度越来越快,得到的数据越来越多,我们就允许自己变得越来越愚蠢。我们不再为最难的难题绞尽脑汁,而只是在数以亿计的数据中加入更多的数据。这有点像用图形计算器来做高中的微积分作业——除非你真正理解微积分的原理,否则它没什么用。
给Google翻译输入的数据从一百亿增加到一万亿就能够让它变成人脑翻译机了吗?似乎不太可能。无论搜索引擎、图片识别、回答问题、计划、阅读、写作或者任何你宁愿要人脑而不是电脑来完成的任务而言,都是一样的道理。
在越来越商业化的人工智能界,包括诺维格在内,人们就算没有隐约感到害怕,也至少是清楚认识到了危机所在。“我们其实可以画一条曲线看看:随着数据量变大,系统是否会越来越好?答案是,系统依然会变好但进步的幅度明显变小了。”
詹姆斯·马歇尔(James Marshall)是侯世达以前的学生,对他而言道理很简单,“最终能带你走向终点的,一定是艰难的那条路。”
侯世达到了三十五岁才开始他第一段长期稳定的感情。他说自己生来“谐振曲线就很窄”,借用了一个物理学概念来形容他的极度挑剔。“的确有一些女人曾对我产生重大影响;她们的脸蛋对我的影响意义重大。我也没法给你细说具体的长相。但这种情况很少见。”1980年,在度过了他口中“十五年黯淡无光的缺爱岁月”之后,他遇到了卡罗尔·布拉什(Carol Brush)。相识不久,两人便结婚,并生下两个小孩。1993年,他们一家到意大利度假时,卡罗尔突然因为脑瘤去世。丹尼和莫妮卡当时分别五岁和两岁。“我能感到他在卡罗尔去世之后彷徨了很久。”侯世达多年的好友潘迪·卡纳瓦(Pentti Kanerva)说。
侯世达整整三十年都没有参加过人工智能界的大会。“我和那些人没办法沟通,”他提起他的同行时这么说道,“完全不行。虽说我称他们为同行,但其实也不能算作同行——我们都没法进行交谈。”
侯世达不经意间会让我觉得有点难相处。他人很好,但并不健谈,也不像受欢迎的老师一样,会撷取你所说的话中最精彩的部分——将你的观点融入他们的思想,就好像你的观点对于他们的论证来说不可缺一般。我旁听了侯世达和学生们的一场圆桌讨论会,他几乎不曾改变自己的观点,似乎仅仅是来求得他人的认同的。讨论会从一开始就像是他群发给记者的一封邮件,他似乎只对最热情的回复还以最热情的回应。
“我不喜欢开会,”他对我说,“我不喜欢去参加会议,然后遇到一群固执己见的人,他们的想法我不同意,我的想法他们又不理解。我只想和能有共鸣的人交谈。”
从十五岁左右开始,侯世达每十年就会读一遍《麦田里的守望者》。在2011年的秋天,他在本科生研讨课上讲述“为什么塞林格的《麦田里的守望者》是一本伟大的小说?”他对霍尔顿·考尔菲德有一种感同身受的亲切感。当我提到我高中班上许多同学都不喜欢霍尔顿——他们认为他就只知道抱怨——侯世达解释说“那或许是因为他们没有看到他的脆弱”。想象一下侯世达像霍尔顿在小说开头一样,独自站在山顶,看着同学们在山下踢球嬉闹。“我已经有够多想法了,”侯世达告诉我说,“并不需要外界的激励。”
当然了,远离纷争带来的后果是你也没法参与讨论。“科学界很少会有非黑即白的情况,”侯世达过去的学生鲍勃·弗兰治(Bob French)说,“从板块构造说到进化论,一切想法都需要有人为其抗争,因为人们不会轻易同意或接受这些想法。在学术界的混战中,如果你不捍卫自己的想法,就只能接受被忽视的命运,而其他人如果积极为自己的观点抗争,即使不太好的想法也可能成为主流。”
侯世达从来都不想争取,也不必争取,这可以说是他事业的双刃剑。三十五岁获得普利策奖之后,他立马成为了学校的宠儿,获得终身教职。他不需要在期刊发表论文;不需要让人审核自己的文章,也不需要回应他人的评论。他的出版社基本书局(Basic Books)随时愿意出版他的任何作品。
斯图亚特·罗素很直白地说:“在学术界,并不是说你坐在浴缸里灵光一现,然后其他人就会对你的发现欣喜若狂,奔走相告。也许再过五十年,我们会说,我们当时真该听侯世达的。但努力让人们理解并认可自己的想法是任何一个科学家的职责。”
侯世达常常说,“我只是觉得生命短暂。我只想做我的研究,能不能发表无所谓。”他曾跟我说过一个类比。他说爱因斯坦在1905年的时候就提出了光子假说,但一直到1923年才有人接受。“整整十八年,只有爱因斯坦一个人相信光是作为粒子存在的。”
“一定非常孤独。”
——别走,此处有赠书——
神书《集异璧》(GEB)作者侯世达又出神作,带你穿过表象的迷雾,探析思考的本质。侯世达亲自参与《表象与本质》中文版的封面设计与译稿翻译,与三位译者共同碰撞出中文例子,再现《集异璧》的本土化翻译创举。
留言点赞数最高的读者(仅限订阅号平台)
(截至明天中午12点前)
将获得《表象与本质》侯世达亲笔签名版一本(全球限量100本,每本签名都有独特的创意)
点赞排名第二、三名获得《表象与本质》一本
请后台留下自己的联系方式:用户名+地址+手机号
我们将择日送书到三位手中
没赶上的
只能点下方小程序自己掏腰包了:
《表象与本质:类比,思考之源和思维之火》(Surfaces and Essences: Analogy as the Fuel and Fire of Thinking)
“利维坦”(微信号liweitan2014),神经基础研究、脑科学、哲学……乱七八糟的什么都有。反清新,反心灵鸡汤,反一般二逼文艺,反基础,反本质。
投稿邮箱:wumiaotrends@163.com
合作联系:微信号 liweitan2018
点击小程序,或阅读原文进店
☟