查看原文
其他

我们制造机器人的思路错了吗?

The following article is from 科学大院 Author 加来道雄

来源 | 科学大院 (ID:kexuedayuan)
作者 | 加来道雄

由于看到了电影中所描绘的机器人,我们或许会认为开发出具备人工智能的成熟机器人是近在眼前的事情。事实却大相径庭。当你看到一个机器人像人类一样行动时,其中多半另有奥妙。也就是说,有个人躲在暗处用话筒通过机器人说话,就像《绿野仙踪》中的巫师那样。

事实上,我们最先进的机器人,比如在火星上漫游的机器人,其智商只相当于一只昆虫。在麻省理工学院著名的人工智能实验室,哪怕是蟑螂都能做到的事,比如在一间满是家具的房间里移动、寻找藏身之所和识别危险,实验机器人都很难复制。地球上没有一个机器人可以理解人们给它朗读的简单儿童故事。

(图片来源:Pixabay)


人工智能,或者说AI,与我们目前所探讨的技术不同,我们对于支撑它的基础原理的了解仍旧很少。虽然物理学家对于牛顿力学、麦克斯韦的光学、相对理论和原子、分子的量子理论理解得非常充分,但人工智能的基本原理仍旧被迷雾笼罩。人工智能领域的牛顿或许还没有出生。但是,数学家和计算机科学家仍旧顽强无畏。对他们来说,一台能够思考的机器走出实验室只是个时间问题。


将形状和常识写到光盘上:自上而下


数十年来,科学家们面临至少两个妨碍他们制造机器人的大问题:形状辨识和常识。机器人可以比我们看得更加清楚,但是它们不明白自己看到的是什么。机器人同样可以比我们听得更清楚,但它们不明白自己听到的是什么。


为了解决这两个问题,研究者们尝试使用“ 自上而下法”(有时被称为“形式”派或GOFAI,即“有效的老式人工智能”)。大致来说,他们的目的就是将所有的形状辨识和常识都编写到一张光盘上。他们相信,将这张光盘插入计算机后,计算机能够突然变得有自知,并且获得人类的智力。在20世纪50年代和60年代,随着能够下棋、拼积木的机器人的出现,这一方向的研究取得了巨大的进展。这些进展是非常惊人的,以至有人预测在数年内机器人的智力将超越人类。


1969 年,在斯坦福研究所,机器人SHAKEY 制造了一条重要新闻。SHAKEY 是一台放置在一组轮子之上的小型PDP 计算机,顶部有一个摄像头。摄像头能够勘察整个房间,计算机会分析和辨认那个房间里的物体,并且试图在物体之间穿过。SHAKEY 是第一台能够在“真实世界”中导航的机器人,这促使记者们猜测机器人何时会把人类甩在后面。


但是,这种机器人的短处很快就显露了。人工智能的自上而下法造就了体积巨大、笨拙的机器人,它们要花费几个小时才能穿过只放置了直线形态物体——正方形和三角形的特殊房间。如果在房间里放置不规则形状的家具,机器人将没有能力辨认。


具有讽刺意味的是,一个大脑含有25万个神经元——能力仅有这些机器人计算机几分之一的果蝇能够不费吹灰之力地在三维空间导航,完成令人眼花缭乱的翻筋斗飞行移动,而笨重的机器人却在二维空间迷失方向。


自上而下的方法很快就碰了壁。计算机生活研究所的主管史蒂夫·格兰德说,像这样的方法“有50年的时间自我证明,但表现仍旧没能与他们的承诺相符”。


20世纪60年代,科学家们没有充分认识到,为机器人编程以完成任务——哪怕是简单的任务,比如为机器人编程以辨认钥匙、鞋子和杯子等物件,所涉及的工作有多么艰巨。就如麻省理工学院的罗德尼·布鲁克斯所说的:“40年前,麻省理工学院的人工智能实验室委派一名本科生在一个夏天里解决这一问题。他失败了,而我于1981 年写博士论文的时候,在同一个问题上失败了。”实际上,人工智能研究者们目前仍然没有解决这个问题。


例如,当我们进入一个房间时,我们会立刻识别出地板、椅子、家具、桌子等等。但是,当一个机器人扫视房间的时候,它看到的只是一大堆直线和曲线,它将这些转换成像素。理解这一大团乱糟糟的线条要花上很多的时间。辨认出一张桌子或许会花掉我们几分之一秒的时间,但是一台计算机只能看到一堆圆形、椭圆形、螺旋、直线、曲线、边、角等等。在漫长的计算时间过后,机器人或许最终能认出某一个物体是桌子。但如果将图像旋转,计算机就不得不完全重新识别。换句话说,机器人可以看,并且比人类看得更清楚,但它们根本不知道自己看到的是什么东西。在进入一个房间后,机器人只会看到一团线条和弧形,没有椅子、桌子和灯的概念。


我们的大脑在我们走进一个房间的时候无意识地通过数万亿次计算识别出物体——这是一种我们全然不觉的活动。我们对自身大脑活动全然不觉的原因是进化。如果我们独自在森林中遇见一只冲过来的剑齿虎,要是我们意识到了所有辨认危险和实施逃跑所需的计算,我们将会瘫软。为了生存,我们需要做的一切只是了解如何逃跑。当我们生活在丛林中时,我们完全无须觉察大脑识别地形、天空、树木、岩石等等所必需的一切输入和输出活动。


换言之,我们大脑的运转方式可与一座巨大的冰山相提并论。我们只窥见了冰山一角——意识心理。但潜伏在表面之下、隐藏在视野之外的,是一个更大的部分——无意识心理,它消耗了大量的大脑“计算能力”以理解周围事物,比如辨认出你在哪里、与人谈话的人是谁和你的周围有什么。所有这些都在没被我们允许和了解的情况下完成。


这就是机器人无法在房间里导航、阅读手写体、驾驶货车和汽车以及捡垃圾等等的原因。美国陆军已经投入上亿美元试图开发机械士兵和智能火车,但没有获得成功。


科学家们开始意识到,下棋或将巨大的数字相乘只需要人类智力的很小部分。IBM 计算机“深蓝”于1997年在一场六局比赛中打败世界象棋冠军加里·卡斯帕罗夫,那是一场原始计算能力的胜利,但这场实验没有给我们带来任何关于智能或者意识上的收获,尽管比赛登上了许多新闻头条。据印第安纳大学的计算机科学家侯世达说:“我曾经以为下棋需要思考。现在,我认识到它不需要。那并不意味着卡斯帕罗夫不是一位深层次的思考者,只说明你可以在下棋时避免进行深度思考,那是一种不用拍动翅膀就能飞起来的方法。”


“深蓝”机组之一(图片来源:flickr.com)


计算机领域的发展同样会对职业市场的未来产生巨大影响。未来主义者有时会猜测,在未来几十年后,能保有工作的只有经验极丰富的计算机科学家和技术人员。但事实上,清洁工、建筑工、消防员、警察等工作者在未来仍会找到工作,因为他们的工作涉及形状识别。每一桩犯罪事件、每一包垃圾、每一种工具和每一场火灾都各不相同,因此机器人无法胜任。讽刺的是,受过大学教育的雇员,比如低级别会计师、股票经纪人和出纳员,可能会在未来失业,因为他们的工作是半重复性质的,并且涉及数字跟踪——一项计算机擅长的工作。


除了形状识别,开发机器人所面临的第二个问题更为基本,那就是它们缺乏“常识”。例如,人类知道:


● 水是湿的

● 母亲比女儿年长

● 动物不喜欢疼痛

● 人死后不会复生

● 绳子是可以拉的,不可以推

● 棍子可以推

● 时间不会倒流


但是,没有任何微积分或数学算式可以表达这些事实。我们知道这些事实,是因为我们看到过动物、水和绳子,而且我们自己理解了这些事实。孩子们通过与现实世界的碰撞学会常识。生物学和物理学的直觉定律是通过与现实世界的互动,以艰难的方式习得的。但是机器人没有经历过这些。它们只知道事先编入程序的内容。


因此,未来的职业还将包括那些要求具备常识的工作,即艺术创造力、原创性、表演才能、幽默感、娱乐、分析和领导能力。正是这些品质使我们成为计算机难以复制的、独一无二的人类。


因此,未来的职业还将包括那些要求具备常识的工作,即艺术创造力、原创性、表演才能、幽默感、娱乐、分析和领导能力。正是这些品质使我们成为计算机难以复制的、独一无二的人类。


在过去,数学家们曾经试图编制一个速成程序,能够一次性收集一切常识法则。最为雄心勃勃的尝试当属CYC(“百科全书”encyclopedia 一词的简写)——赛克公司负责人道格拉斯·莱纳特的构想。正如耗资20亿美元建造了原子弹的巨型项目“曼哈顿计划”,CYC被比作人工智能领域的“曼哈顿计划”,是实现真正人工智能的终极推力


不出所料,莱纳特的座右铭是:智能是1000 万条规则。


莱纳特用一种新奇的方式寻找常识的新规律;他让他的雇员朗读花边小报的版面和耸人听闻的八卦杂志,然后问CYC是否能指出小报上的错误。其实,如果莱纳特成功,那么CYC将在事实上比大多数小报读者更聪明!


CYC的目标之一是实现“收支平衡”,也就是说,机器人能够开始理解足够的知识,因而可以简单地通过在图书馆里找到的杂志和书本来消化新信息的临界点。到那时,CYC 就能像雏鸟离巢一般,扇动翅膀,自己起飞。


但自从公司于1984 年建立以来,它的信誉就遭遇了人工智能领域的一大普遍问题:做出能成为要闻但很大程度上不现实的预测。莱纳特预测:在10 年内,即到1994 年,CYC将包含30%~50%的“共识现实”。如今,CYC仍旧没有关闭。根据赛克公司的科学家发现的,为了让一台计算机接近一个四岁幼儿所拥有的常识水平,必须编制数百万行编码。现在,CYC仅包含微不足道的4.7万种概念和30.6万个事实。与赛克公司定期发布乐观的新闻稿相悖,莱纳特的同事之一、1994 年离开公司的G.V.古哈所说的话被引用:“总的来说,CYC被视为一个失败的项目……我们竭尽全力试图实现自己承诺的一小部分。”


换言之,将全部常识原理编入一台计算机的努力已经举步维艰,理由很简单——常识的法则浩如烟海。人类能不费吹灰之力地学会这些法则,因为我们一生都在不断地投入外界环境,静静地吸收物理学和生物学规律,但机器人不会


微软的创始人比尔·盖茨承认:“让计算机和机器人去感受他们周围的环境,并且迅速、准确地做出反应,要比预想的难得多……例如,根据房间里的物体确定自己方位的能力、对声音做出反应和理解发言的能力,以及抓住不同大小、质地和易碎程度的物品的能力。哪怕是像说出一扇敞开的门和一扇窗户之间的区别这样简单的事情,对于机器人而言也是极为棘手的。”


然而,“自上而下法”的支持者们指出,这一方向的进展尽管有时会很缓慢,但正在世界各地的实验室中发生。


比如,在过去的几年里,常常资助尖端科技项目的美国国防部高级研究计划局(DARPA)已经为能够自主穿越莫哈韦沙漠中崎岖地带的无人驾驶汽车赞助了一笔200万美元的奖金。2004年的DARPA 挑战赛没有一个参赛者能够完成赛程。事实上,表现最好的车设法在失灵前跑了7.4英里。但在2005年,斯坦福车队的无人驾驶汽车成功跑完了令人精疲力竭的132 英里全程(尽管花了7个小时)。其他四部汽车也完成了赛程。


有些批评者注意到,规则允许汽车沿着一条沙漠小径使用GPS 导航系统。事实上,汽车可以沿着一条事先确定、没有太多障碍的路线图前进,因此汽车永远都不用指认它们路途中复杂的障碍物。在实际驾驶中,汽车必须在毫无预料的情况下辨明方向,绕过其他车辆、行人、施工地点、交通堵塞等等。


比尔·盖茨对于机器人机械将成为“下一个大事件”的观点持谨慎的乐观态度。他将目前的机器人领域比作他30年前协助启动的个人计算机领域。正如个人计算机,它可能已经做好了展翅高飞的准备。“没有人能确定地说出这一产业何时或者是否能产生巨大的影响,”他写道,“但如果它能,那么将大大改变这个世界。”


一旦拥有人类智能的机器人进入商业供应,它们的市场将是巨大的。尽管真正的机器人现在还不存在,但预先编程的机器人真的存在,并且数量激增。日本机器人协会预测,到2025年,个人机器人产业将达到每年500亿美元产值的规模。


(图片来源:veer图库)


婴儿怎么学的,机器人就怎么学:自下而上


由于人工智能自上而下法的局限,在这一领域的尝试已经转而采用一种自下而上的方式,即模仿进化过程和婴儿学习的方式。例如,与超级计算机的处理方式不同,昆虫并不是通过扫描周围环境再将其压缩成数万亿个像素来进行导航的。取而代之的是,昆虫的大脑是由“神经元网络”组成的,通过投入充满敌意的世界来慢慢学会在如何在其中行走。


在麻省理工学院,能行走的机器人声名狼藉,难以通过自上而下的方式制造出来。但是,投入周围环境、从零开始学习的简单的昆虫形态的机械生物,已经能成功地在几分钟内绕着麻省理工学院的楼梯小步疾跑了。


麻省理工学院著名的人工智能实验室由于其巨大、笨拙的“自上而下”的行走机器人而闻名,其负责人罗德尼·布鲁克斯在探索微型“昆虫”机器人这一概念的时候变成了“异端者”。这些“昆虫”机器人在磕磕绊绊中学习老式行走方式。他没有使用复杂的计算机程序来精确计算它们行走的时候脚的精确位置,而是以很少的计算机能力,通过测试与错误来协调它们的腿部动作


今天,许多布鲁克斯发明的昆虫机器人的后代正在火星上为NASA(美国国家航空航天局)收集数据,依靠自己的思想小步疾跑,穿过荒凉的火星表面。布鲁克斯相信他的昆虫适合对太阳系的探索,非常理想。


布鲁克斯的项目之一是COG,目的是制造一台具有6个月大婴儿的智力的机器人。COG的外表像是一团乱糟糟的电线、电路和齿轮,只不过它有头、双眼和手臂。它没有被写入任何智能法则。取而代之的是,它的双眼注视着一位人类训练师,他试着教会它简单的技能。


虽然有模仿昆虫行为的成功案例,但当编程人员试图在机器人身上复制哺乳动物等高等动物的行为时,使用神经网络系统的机器人都表现得极差。


最先进的使用神经网络系统的机器人可以在房间里走动或者在水中游泳,但它无法像狗一样在森林里跳跃和狩猎,或者像老鼠一样在房间里四处快跑。许多大型神经网络系统机器人可能会由数十个到数百个神经元构成,然而,人类大脑拥有超过1000 万个神经元。线虫是一种简单的蠕虫,其神经系统已经被生物学家完全绘制出来。它的神经系统仅有300多个神经元,这使得它的神经系统成为自然界中发现的、或许是最为简单的神经系统之一。但是这些神经元之间有7000多个突触。即使像秀丽隐杆线虫这样简单的生物,其神经系统也极为复杂,以至没有人能够建立其大脑的计算机模型。(1988年,一位计算机专家预测,到目前为止,我们应该拥有具备超过1 亿个人造神经元的机器人。事实上,具备超过100个神经元的神经系统就被认为很杰出了。)


最为讽刺的是,机器能够毫不费力地完成人类认为“困难”的工作,比如将很大数字相乘或者下棋;但是机器在被要求完成对于人类而言极简单的工作时(比如走过一间房间、辨认面孔或者与朋友说长道短)却会严重出错。原因是,我们最先进的计算机在本质上仅仅是做加法的机器。可是,我们的大脑是经过进化的精心设计,以解决世俗的生存问题的,这需要一整套复杂的思维结构,如常识和模式识别。在森林中生存并不依赖于微积分或国际象棋,而是依靠躲避天敌、寻找配偶,适应不断变化的环境。


麻省理工学院的马文·明斯基,人工智能最初的奠基人之一,这样总结人工智能所存在的问题:“人工智能的历史有点儿可笑,因为最初的实际功绩都是美丽的事物,比如能够做出逻辑论证或者在微积分课题中取得好成绩的机器。但随后我们开始试图制造能够回答关于初级阅读材料中简单故事的问题的机器。目前没有机器可以做到这一点。”


(图片来源:Pixabay)


未来并不遥远


有些人相信,最终将会出现介于自上而下和自下而上两种途径之间的绝妙综合体,它或许将提供通向人工智能和类人机器人的道路的关键。


归根结底,当一个孩子学习的时候,虽然他最初主要依赖自下而上法,投入他周围的环境,但最终他会获得来自父母、书本和学校教师的指点,用自上而下法学习。作为成年人,我们不断将这两种方式混合使用。例如,一位厨师阅读食谱,但也不断在烹饪的过程中试吃菜肴。


汉斯·莫拉维克说:“当机械化的金钉子被用于努力将两种方式合为一体的时候,完全智能化的机器将会产生。”这或许会发生在未来40 年内。


参考:

本文节选自中信出版集团出版的《不可思议的物理》,有少量编辑。



版权说明:本文经授权转自“科学大院”微信公众号,未经授权严禁任何形式的媒体转载和摘编,并且严禁转载至微信以外的平台!



文章首发于科学大院,仅代表作者观点,不代表科学大院立场。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存