查看原文
其他

现代机器人之父:预测 AI 的七宗致命罪状 | Rodney Brooks 特稿

2017-10-07 DeepTech深科技


谷歌AI是否能征服星际争霸?DT君在明年1月举办的全球新兴科技峰会,谷歌 DeepMind 研究科学家、《星际争霸》AI计划负责人 Oriol Vinyals 将发表主题演讲。预知详情,请点击图片!


罗德尼·布鲁克斯(Rodney Brooks),斯坦福大学博士,美国著名机器人制造专家。包容体系结构的发明者,麻省理工学院计算机科学和人工智能实验室(CSAIL)的前任领导,同时还是美国人工智能研究协会(AAAI)的创建者。20 世纪 90 年代设计了第一个火星机器人,他同时也是著名机器人公司 iRobot 和 Rethinks Robotics的创办者,也被业界称为“现代机器人之父”。

 

下文由 Rodney Brooks 撰写,由 MIT Technology Review 在中国大陆地区

独家授权发布



错误的推断,有限的想象力,以及一些其他常见的错误,这些都使得我们无法有效地思考未来。

 

我们对于人工智能和机器人技术的未来充满了一种狂躁的臆想——幻想着它们将会变得多么强大、多么迅速以及它们将会对就业产生怎样的影响。

 

最近,我在 MarketWatch 上面看了一个故事——在 10 至 20 年内机器人将会取代目前人类一半的工作——它甚至用到了一张图表来描绘这个数字。

 

 

这样的说法十分荒谬!(我试着去保持专业的语言,但有时……)举个例子,这个故事似乎表明,在 10 至 20 年内,美国的路面维修工人将由一百万人减少到五十万人,因为机器人会接管这些工作。而目前又有多少机器人在这些岗位上呢?零。又有多少机器人在这个领域工作的实际案例呢?零。类似的道理同样也适用于那些指出我们将会看到 90%的工作在未来逐渐消失的故事。

 

错误的预测会引发我们对那些不会发生的事情的恐惧,无论是对现有工作的大规模破坏,奇点或是人工智能的出现,这些都与我们的价值观相悖,并且可能会试图毁灭我们。我们应该抵制这些错误。但是人类为何要犯下这些错误呢?我发现了以下七个常见的原因。

 


高估和低估

 

罗伊·阿玛拉是未来研究所(the Institute for the Future)的联合创始人。他最广为人知的是他的格言——现在被称为阿玛拉定律:我们总是倾向于高估一项科技所带来的短期效益,却又低估它的长期影响。

 

这一个句子中包含了很多东西。乐天派可以从一方面解读,而悲观者则可以有不同的解读。

 

美国的全球定位系统是解释阿玛拉定律两个方面的一个很好的例子。自 1978 年起,有 24 颗卫星(目前包括备件有 31 颗)不断地被放置在地球轨道上。全球定位系统目的是让美国军方精确地提供军火。但是在 20 世纪 80 年代,这个项目多次面临被取消。它的第一个实际用途是在 1991 年的尘暴中,美国军方接受了它的作用,并取得了一些成功。

 

图丨GPS卫星


如今 GPS 的用途是最初人们完全没有意料到的,这符合阿玛拉定律中的长期影响。我的第二代 Apple Watch 在我外出跑步时会使用 GPS,其记录的定位精确到足够分辨出我在沿着街道的哪一边跑步。对于早期的 GPS 工程师来说,信号接收器的微小尺寸及价格会是难以理解的。


这项技术在全球范围内同步进行物理实验,并在同步美国电网和维持其运正常转方面扮演着重要角色。它甚至允许那些真正控制股市的高频交易员规避灾难性的同步误差。无论或大或小,我们所有的飞机都使用它来导航,并且它还被用来追踪那些被假释出狱的人。它决定了全球各个地区应该种植哪种种子。它可以监测车辆踪迹并报告驾驶员状况。

 


GPS 最开始只有一个目的,但如何让它发挥除了预期目标之外的作用是一个艰巨的任务。如今 GPS 已经渗透到我们生活的方方面面,但如果我们失去了 GPS 我们不仅仅只是会迷路那么简单;我们还会感到寒冷,感到饥饿,甚至可能会死去。

 

近 30 年里其它科技的发展也是类似的模式。起始人们抱有极大的希望,但逐渐开始失望,而后来对其取得的超出预期的成果慢慢产生信心。计算法、全基因组测序、太阳能发电、风力发电、甚至是杂货铺送货上门也同样如此。

 

从 20 世纪 60 年代、80 年代,人工智能被一次又一次的高估,而且我坚信今天亦是如此,但它的长期影响也同样可能被低估了。问题是:长期的时间具体是多少?接下来的六个错误有助于解释为什么人工智能的未来会被严重低估。

 

 

想象的魔力

 

当我十几岁的时候,亚瑟·克拉克(Arthur C. Clarke)与罗伯特·海因莱因(Robert Heinlein)及艾萨克·阿西莫夫(Isaac Asimov)并称为三大科幻小说作家。但克拉克同时还是一个发明家、科学作家和未来主义者。在 1962 到 1973 年间,他提出了三条格言,这后来被称为克拉克三大定律:

 

  • 如果一个年高德劭的杰出科学家说,某件事情是可能的,那他几乎一定是正确的。但如果他说,某件事情是不可能的,那他很有可能是错的。

  • 要想弄清楚一件事是否可能,唯一的途径是稍稍突破二者的分界线,冒险进入不可能的领域。

  • 任何极其先进的技术都与魔法无异。

 

图丨亚瑟·克拉克


个人来说,我认为应该提防第一定律中的第二句话,因为对于人工智能将会以多快的速度崛起,我比其他人更加保守一些。但目前来说,我想就克拉克第三定律进行阐述。

 

想象一下,我们拥有一台时光机可以将艾萨克·牛顿从 17 世纪晚期传送到今天,放在一个他熟悉的地方:剑桥大学三一学院教堂。

 

图丨剑桥大学三一学院教堂


现在给牛顿展示一部苹果手机。从你的口袋里拿出一部 iPhone,解锁它,这样布满了图标了的屏幕就会发光,然后把它递给牛顿。通过使用棱镜将太阳光分解,揭示了白色光是如何由不同颜色的光组成的,然后将其重新组合起来的牛顿无疑会对这个在漆黑的小教堂发出了生动色彩的小玩意儿感到惊讶。现在播放一个关于英国乡村场景的电影,还有一些他曾听过的教会音乐。然后,给他展示一个有五百多页他自己关于他的杰作原理注释的网页,教他如何使用缩放手势来放大细节。

 

牛顿能解释这个小设备是如何做到这一切的吗?尽管他发明了微积分并解释了光和重力,但他却无法把化学从炼金术中区别开来。所以我认为他会感到困惑,甚至无法回想起这个设备最开始的相关轮廓。这与他十分感兴趣的超自然的体现没有什么区别,它和魔法是无法区分的。记住,牛顿是一个极其聪明的家伙。

 

图丨牛顿


如果一件事物是魔法,那我们就很难去发现它的局限性。假设我们进一步的向牛顿展示这个设备如何在黑暗中照明,它是如何拍摄照片录制视频及录制声音,如何将它用作一个放大镜和镜子。然后我们向他演示,这个设备如何用不可思议的速度进行算术运算并精确到多位小数。就在教堂里,我们指导他操作设备时应采取的详细步骤,并告诉他可以用这个设备同世界上任何地方的人即时交流。

 

牛顿还能推测出这个设备的其他用途吗?棱镜无需能源就能永远工作下去。他是否会推断出 iPhone 会永远工作下去,而忽略了它需要充电的情况呢?回想起来,我们在法拉第诞生 100 年前我们就抓来了他,所以他缺乏对电能的科学理解。既然 iPhone 在无需火的情况下就能成为光的来源,那么它也许会将铅转化为黄金?

 

这就是我们想象未来科技时都会出现的问题。如果它距离我们如今拥有且能够理解的科技足够遥远的话,我们就发现不了它的局限性。如果它变得和魔法无二,人们所说的关于它的一切都不再被证伪。

  

当我与人们争论是否我们应该为通用人工智能(即 AGI, 我们将建立像真实生物一样运行的有着自主意识的实体)感到恐惧,我经常会遇到这样的问题。我被告知,不了解通用人工智能将会有多么强大。这不仅仅只是一场争论而已。

 


我们不知道是否它应该存在。我更希望它存在——这一直是我在机器人技术及人工智能领域工作的动力。但如今通用人工智能研究在普及和支撑实际存在的独立实体方面做的并不好。

 

在至少 50 年内,人工智能在推理及常识方面都会遇到同样的问题。我所见到的证据都表明我们还没有办法去建立一个可以独自思考的实体。它的属性是完全未知的,所以它很快就会被形容为魔法,强大到没有界限。

 

宇宙中没有任何东西是没有界限的。

 

注意关于未来科技的争论,这是不可思议的。这样的争论永远不会被驳倒,因为这是一个基于信仰的争论,而不是基于科学。

 

 

表现 VS 能力

 

我们都使用人们如何完成某些特定任务的情况来评估他们完成一些不同任务的状况。在一个外国城市里,我们向街上的一位陌生人寻路,然后她满怀信心的回答并指出似乎正确的方向,所以我们就认为当你想乘坐公交车时,也可以询问她当地的付费系统。

 

现在假设有人告诉我们在给定的的照片中,人们在公园里玩飞盘。我们很自然的就会认为这个人可以回答这样的问题:飞盘长什么样子?一个人可以将飞盘扔多远?飞盘能吃吗?能有多少人同时玩飞盘?三个月大婴儿能玩飞盘吗?今天的天气适合玩飞盘吗?

 


那些可以给照片贴上“人们在公园玩飞盘”标签的电脑并没有能力回答这些问题。此外,事实就是电脑只能给更多的照片打上标签而不能回答问题。人究竟是什么,公园通常是露天的,人们有年龄之分,天气不仅仅是照片中表示的那么简单等等,电脑对这些完全没有概念。

 

这并不意味着这些系统是无用的,对搜索引擎而言它们有巨大的价值。但这样问题来了:人们了解到一些机器人或者人工智能系统完成了一些任务,然后就将它们的表现归结于能力,即执行同样任务的人可能会有的能力。并且他们将其泛化应用到机器人或人工智能系统中。

 

如今,机器人和人工智能系统能做的事情仍然十分有限。人类的归纳推理方式对它们并不适用。

 

 

行李箱词汇

  

马文·明斯基将有着很多意义的单词叫做“行李箱词汇”。学习就是一个强大的行李箱词汇。它可以指代很多不同类型的经验。学习使用筷子是一种不同于学习新歌曲的体验。学着写代码更是与在城市里认路完全不同的体验。

 

图丨人工智能之父马文·明斯基

当人们听说机器学习在一些新领域取得了巨大进步时,他们总会趋向于使用同人们学习新事物一样的心智模型。然而,机器学习却非常脆弱,它需要大量的准备工作,包括研究人员或工程师,专用编码,特殊训练数据集以及各个领域的自定义学习结构。现如今的机器学习并不像人类从事的那种像海绵一样的学习那样,无需专门的设计就能在一个新领域取得快速进步。

 

类似的,当人们听说计算机可以击败世界象棋冠军(于 1997 年)或者世界上最好的围棋选手之一(于 2016 年)时,他们趋向于认为机器可以像人类一样“玩”游戏。当然,在现实中这些程序完全不知道游戏是什么。它们的适应能力也比较弱。当人类在玩游戏时,规则的小小改变并不会过多的影响他们。而对于 AlphaGo 或者 Deep Blue 则不是这样。

  

行李箱词汇在误导人们说机器可以在人类能做的事情上做的多么优秀。这在一定程度上是因为人工智能研究人员——更糟糕的是, 他们的新闻工作室——总是急于阐述行李箱概念的进步实例。这里的重点是“实例”。而这一细节很快就会消失。新闻标题大肆宣扬行李箱词汇,而这扭曲了人们对于人工智能在哪和它有多接近完成更多任务的广泛认知。

 


指数增长

 

很多人正在深陷“指数主义”的窘境。

 

在半导体领域著名的摩尔定律似乎正在遭遇“失效”的危机,虽然在过去的 50 年的时间里同等尺寸的集成电路上所容纳的元器件在以每年翻一倍的速度增长,但近年来,这一速度已经延长到了两年多的时间才能翻番,似乎预示着定律即将被终结。

 

图丨戈登·摩尔


而之所以摩尔定律被高度重视,是因为芯片组件的指数增长意味着计算机运算速度的不断提高、内存容量的不断翻倍、数码相机将会有更高的分辨率,甚至液晶显示屏的像素都会以指数级增长。

 

但摩尔定律也有其受限的适用条件,随着芯片集成元器件越来越小,其已经逐渐逼近了物理的极限。此时此刻,科学家们不得不更换一条思路,于是,量子效应开始占据了主导,伴随着硅基芯片技术也开始流行开来。

 

不过,这也引起了人们的思考,当我们深陷“指数主义”的狂欢中时,可能会觉得这将会一直增长下去,但从现实来看,不论是摩尔定律还是其它的指数定律,似乎都将面临瓦解的风险,究其原因,也许从一开始将它们定义为“指数”定律就是错误的。

 

就举我自身的一个例子,在十多年前的时候,我负责麻省理工学院计算科学和人工智能实验室(CSAIL)的管理工作,当时我们手上有 90 多个不同的研究项目,需要大量的研究资金。而为了向我们的资助方证明摩尔定律的巨大潜力,我用当时刚推出的 iPod 为例来做以说明,下面就是历年 iPod 内存的增长情况:


 

然后我会推断出未来几年,iPod 的存储能力将会有多少。

 

根据我们的预计,一台价值 400 美元的 iPod 到今天将会有 16 万 GB 的内存。但是今天顶级的 iPhone 的内存却也只有 256 GB,不到 2007 年 iPod 的两倍。


事实上,一旦设备的存储能力大到足够容纳任何音乐、视频或程序时,指数效应就会瞬间崩溃。而尤其是当存储能力的增长受到物理限制或失去经济价值的时候,摩尔定律这种指数增长也会难以为继。

 

恰巧在这个时候,深度学习技术的飞跃促使 AI 系统性能的急剧增长,于是很多人认为“摩尔定律”的传奇将在 AI 时代得以延续。不过,事实恐怕没有那么乐观,深度学习技术已经被发展了 30 多年,它的成功仅仅是一个个例。

 

或许在未来会有许多类似深度学习这样高增长技术的个例出现,当下火热的人工智能浪潮也使得大量相关的应用相继涌现。但遗憾的是,并没有证据表明这种现象将会成为一条定律而一直发挥作用。

 

 

好莱坞式情景

 

许多好莱坞科幻电影给我们的感觉是,未来的世界就像今天并没有什么不同,除了某些新的桥段。

 

在电影《Bicentennial Man》中有一个画面是这样的:由 Sam Neill 扮演的 Richard Martin 正坐着吃早餐,旁边站着由 Robin Williams 扮演的人形机器人,当理查德在吃早餐时拿起报纸阅读时,我们会发现,这份报纸仍是印在纸上的,不是平板电脑,也不是像亚马逊 Echo 这样与互联网直接关联的设备。

 


事实证明,许多 AI 研究人员和专家,特别是那些对 AI 失控和杀人充满想象力的悲观主义者,都忽略了一个事实——如果我们最终能够开发出足够智能的设备,那么世界将发生很大变化,我们也不会突然对这种超级智慧体的存在感到惊讶。

 

随着时间的推移,这些智能体将得到充分的技术发展,我们的世界将会充满各种各样的智能形态,我们会拥有大量如何和这些智能体相处和共存的经验。

 

在邪恶的超智能体出现并希望摆脱人类控制之前,肯定有一批不那么聪明和好战的机器。也就是说,在邪恶智能体出现之前,我们首先会大量接触那些脾气暴躁、令人懊恼或者傲慢的机器。在这个过程中,我们会改变这个世界,同时调整新技术和新技术所处的环境。我不是说人类不会遇到挑战。我是说,人类不会像大多数人想象的那样,以突然和被动的姿态遭遇那些意外。

 

 

部署速度

 

在某些行业,软件版本的更新非常频繁。像 Facebook 这类软件平台甚至每小时都会加入新的功能。对于很多新功能来说,只要通过了整合测试,哪怕在实际部署后出现问题需要撤回,也不会在经济上造成什么影响。这是一种硅谷的科技公司以及 Web 开发者们习以为常的方式,而且这种方式之所以行得通是因为部署讯版本软件的边际成本近乎为零。

 


然而部署新硬件的边际成本就高得多了,其实我们在日常生活中就能感受到。比如我们现在购买的大部分汽车都不是自动驾驶车辆,也不是基于软件控制的,这类传统汽车甚至到 2040 年也会在路上行驶。这对自动驾驶车辆的普及无疑是一种限制。再比如,我们现在建一座房子,它 100 年后还会在那,我自己住的房子就建于 1904 年,而且这还不算最老的。

 

所以说即便有更高科技的替代方案,由于较多的资金投入,物理层面的硬件还是会有相对较长的使用周期。

 

现在美国空军的 B-52H 还在继续服役,它是 B-52 轰炸机的改进型。B-52H 于 1961 年加入美国空军,这已经是 56 年前的事了。目前看来,这种机型会继续服役到 2040 年,甚至有消息称军方想让 B-52H 飞满 100 年。

 


我经常能在全世界各地的工厂看见几十年的老设备,甚至包括运行着发布于 1990 年的 Windows 3.0 操作系统的旧电脑。大家的指导思想很简单:“如果没坏就不要动它。”这些计算机虽然老旧,但在过去的二十年,它们一直执行着同样的程序,稳定的做着同样的工作。

 

这些工厂最核心的控制系统是基于可编程逻辑控制器(PLC)的,包括在美国、欧洲、日本、韩国、中国新建的工厂也是如此。1968 年,人们引入了 PLC 来替代之前的机电继电器。但机电继电器的概念到今天仍在沿用,PLC 其实可以理解为编程过的 24 伏机电继电器网络。

 

此外,工厂中的很多电线也被换成了以太网电缆,但这里并不是一个开放网络。以太网电缆在这套全新的“古老”系统中点对点的传递信号,并将信号转换为控制流,从而控制工厂中的机器按步骤执行任务。

 


在全世界大多数工厂中,如果想要改变信息流或控制流,需要耗费数周时间来搞清楚问题出在哪,重新设计流程,然后让工厂技术人员重新对硬件进行配置。一位业内的朋友告诉我,他们的目标是每 20 年做 3 次软件升级……

 

理论上来说,工厂中这种陈旧的系统管理方式应该被摈弃,而实践中却根本做不到。我刚看到一份工作清单,即便在今天,特斯拉汽车的加州弗里蒙特工厂还是在招聘大量的 PLC 技术人员,继续采用机电继电器模拟的方式来生产这些 AI 增强型电动汽车。

 

很多 AI 领域的研究者们认为,世界已经是数字化的了,全新的 AI 系统应该立即部署到供应链、工厂、产品设计中去。然而这种想法离事实还很远,几乎所有机器人和 AI 领域所取得的创新,要真正开始广泛部署,所花费的时间要比人们想象的长太多太多。


-End-



科技英语直播上线 | 跟着《麻省理工科技评论》每天学习科技英语!

点击左下方“阅读原文”进入小鹅通直播间


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存