查看原文
其他

观点 | 洪小文:人工智能简史之人的智慧结构

2017-11-21 洪小文 微软丹棱街5号


丹棱君有话说:微软全球资深副总裁,微软亚太研发集团主席兼微软亚洲研究院院长洪小文认为,人类的智慧如同金字塔结构,底层的智能包括计算和记忆等能力,顶层的智慧则是创造力。目前,机器在计算和记忆方面展示的智能,主要是基于大数据和深度神经网络(DNN)的模式识别能力,而更高级的智能,则是人类拥有的基于小数据甚至是零数据的进行预测和创造的能力。这样的人类智慧从何而来?有请洪小文博士~


人类的智慧应该如同一个金字塔的结构。


金字塔的最底层叫计算和记忆,我们中国一直觉得这属于智慧、智能的部分。我们常常说一个人神机妙算,过目不忘。事实上,所谓的图灵机,冯诺伊曼的架构,计算机里面最重要的,最基本就是 CPU 与内存,一个管计算,一个管存储。


我记得我人生中受到的最大一次打击是在我小学一年级的时候,跟算盘有关。当时选一些比较聪明的小孩去训练珠算,我没有被选上。老师安慰我说,你体弱多病,就算了,为此我还非常郁闷。我当时觉得算盘打得好的人是神童。可是,今天没有人会浪费时间去学计算,也没有人认为会计算有什么了不起——珠算和计算机(甚至计算器)相比是以卵击石。


说到内存,我不知道多少人记得家里的电话号码,我是不记得。所以这有两层意义,一是说,算东西和记东西不要跟机器比;第二,我们觉得这是雕虫小技。


不要和机器比模式识别


这个金字塔结构的更高一层是感知,也就是可以听懂话,可以认识东西。


我一直是做模式识别的,其实从学问来讲,尤其是我们这代人,我觉得认真来说,深度神经网络(DNN)最了不起的一件事情,是在很大的程度把模式识别给解了。“解”的意思是说,当有很多的数据,很大的计算量的时候,我可以不做假设,让它用最好的模式去学,而且不用给它额外的知识,用原始数据就行。它是不是解了 AI,可以打一个大问号;但是它很大程度把统计的模式识别,模式分类,模式匹配给解了。我承认这个 DNN 是蛮了不起的。


再谈一下 AlphaGo,我觉得 AlphaGo 最了不起的是把下棋变成了模式识别。在模式识别方面,理论上人其实是做不过机器的。道理其实非常简单,我举一个例子:假设有 500 个人在做坏事,我们把他们的照片拿给你看,你的工作就是每天在海关看这 500 个人有没有进来。别说 500 个人了,50 个陌生人,要把他们记下来都不可能。而机器却可以硬把它强记下来。


人下棋很大程度上不是在做原始的模式识别,而是要找到路,因为人不可能记那么多模式。人必须要归纳出一些原则性或者算法的东西。人做原始的模式识别是做不过计算机的,所以说难怪 AlphaGo 打赢了,AlphaGo 打赢不能证明 AI 了不起。AlphaGo 基本上是做模式识别,而 DNN 基本上解决了模式识别。所以,模式识别,不要和机器比,否则是在浪费你的生命。


DNN 是一个强大的黑箱


接下来谈一下黑箱、白箱的认知。DNN 以及模式识别基本上是黑箱,有输入进去,然后给出输出。


黑箱有黑箱的好处,黑箱不全是坏事。有一本书叫做《没有偏见的思考》,强调黑箱的好处是没有偏见。人做决定会有偏见,而人如果能够跳出来用黑箱思考,这个社会就会变得更好。其实这个道理我们中国人也都知道,邓小平说黑猫白猫,会抓老鼠就是好猫,这基本上就是黑箱的想法。


黑箱可以解决问题,但不能说明为什么。另外,黑箱没有办法链接(Chaining),就是说没有办法做一些推理。因为黑箱要做推理,唯一的可能就是某一个黑箱的输出,是下一个的输入,否则没有办法做推理。今天的 DNN 是一个黑箱,但是黑箱很强大,正如反馈环路(Feedback Loop)一样,我们人类的行为都可以用这个来表示,比如做科学实验,我们需要收集数据,然后做分析,再决定下一步怎么做;今天,我们做产品也是这样,快速迭代,收集客户的反馈。


物联网有两个部分,一块是传感器(Sensor),一块是执行器(Actuator)。传感器用来感知自然界;执行器用来操作自然界。如果是闭环,就可以收集大量的数据,做成一个黑箱,虽然它很复杂,举个例子,叫做“可预测的维护”(Predictive Maintenance):以前电梯坏了,打电话给电梯公司,电梯公司可能隔两三天派人来,然后回去分析,隔几个礼拜,拿来零件换一下,电梯可能一两个礼拜都不能用。现在,在电梯上装各种传感器,然后收集数据。这时候,如果看到数据是某个样子的(预兆需要维护),就可先派人去维修。电梯是非常复杂的,有各种因素,但是我们可以用这个方法,把它变成一个闭环,变成一个黑箱来处理。


所以 AI 为什么在工业界那么红火?电梯维护是一个例子。这个例子可以引申到任何地方,比如油管检测,人的身体检测。前几年穿戴式非常红火。如果传感器真的很准确,测到身体的任何一样生物信号,那很了不得。就拿癌细胞来讲,将来有可能在癌细胞超过一个临界值之后,就让人知道马上要去医院,有利于早期治疗。其实今天大家讲 AI,数据非常重要,今天的 AI 没有数据是活不下去的,而且还要有很大的计算,我们叫云,两者缺一不可。


窥一斑而见全豹


我们刚刚谈的 AI,其实是一种认知:我们不仅需要知道电梯快出问题了,还要知道怎样修理。也就是说我知道,我有认知。计算机今天的确做了认知的一些东西,但不是全部。


John Seale 是一个哲学家,他提出了一个叫做中文房间的论题(The Chinese Room Argument)(作者提出假设有一台锁在房间中的机器可以完全无障碍地与隔壁房间里面的会讲中文的人交流,人无法判别交谈对象是人还是机器,即便如此,也并不能代表机器能“理解”这样的交谈)。他还提到了图灵测试,如果这个房间里面可以出一个像人一样的回答,我们就说这个机器通过图灵测试,跟人的智慧就是一样。


https://v.qq.com/txp/iframe/player.html?vid=p0339ikbz4k&width=500&height=375&auto=0
其实中文房间所讲的就和我们今天的翻译是一样的。今天的翻译就是查表,然后做回归。你给机器一张纸,机器也不知道是什么字,一对照是这样的(字词)组合,就给出这样的组合,没有理解在里面。其实 AI 有两种,一个叫强人工智能,一个叫弱人工智能,弱人工智能就是模拟,是根本不了解,强人工智能是真的了解。


不过,这里可能会有人挑战我:如果机器通过了图灵测试,那就可以的呀。我们学语音的,有一个概念叫做鸡尾酒效应。我们平常去参加鸡尾酒会,一个很小的空间里面有很多人在讲话,有人讲中文,有人讲英文。不过,站在你旁边的一个人,即使大部分的话你都没听到,还可以交流,为什么?通常我们站在一个人旁边,大家也都相互认识,知道他的背景,所以即使听到几个音,也会猜得八九不离十。


今天没有一个 AI 可以做到这点,但是人为什么可以做到?人不是真正听到他讲的每句话,人不是把信号处理过才知道。人使用的就是“产生并测试”(Generate and Test)。如果是一个陌生人,你大概是没有办法的;但如果对方是一位朋友,因为你对这个人有了解,讲几个音,大概猜猜就可以知道对方说什么了。我们做认知,甚至感知的时候,都利用了自己拥有的其他知识,在视觉上也是一样。假设有一只大象,你只要看到任何一个露出的部分,就可以知道它是一个大象,因为你在脑补其它的地方。你脑中闪过好几个假设,这就叫做产生(Generate),然后测试(Test),然后你就知道大概是这个意思。


今天机器翻译的东西,怎么可能做到这些?就算要做,也要回到最原始的知识表示,还有常识推理,今天这些都没有人谈了。什么叫常识?就好像有一个人吞了一个苹果,用常识也可以知道,一个人不可能吞一个苹果,这个叫做强 AI,真的通过理解去做事情。


人的认知事实上是白盒子,在里面要做因果分析。因果分析是非常复杂的,要回答为什么,而不只回答是什么,更不要说很多事情都是开放的系统。产品就是一个开放的系统,到底下一个产品该放哪些特性,本身就是一个开放的系统,可以用 AI 去自动化么?不可能。还是需要人的智能加机器的智能。当然,我还是要用大数据的分析,给一些线索,来决定人来做什么。此外,投资也不太可能被 AI 取代,因为每一个投资方案都不一样。拿微软做一个例子,我们考虑要不要买领英,这种很大的事情一辈子可能就做一次,你不可能去让一个机器做,因为这次搜集的数据不一定下次还有用;产品也是,做一个错误的产品,不知道要花多少时间去改正它。这种一辈子只做一次的决定,一定是人类智能和人工智能一起做。


创造力不是大数据


算法的定义是通过一步步的操作来解决问题。什么叫创造力?就是你能够产生新的算法,去解一个未解的问题,或者更好的去解一个已解的问题。就这样的定义来讲,我觉得在数学上,推理上很多东西,都是创造力。比如说很有名的高斯,他小时候很聪明,常常去找数学老师问问题。数学老师觉得他很烦,有一天说,你从 1 加到 N,数学老师想他怎么也得花半个小时。结果高斯几分钟就有了答案,创造了一个新的公式。这显然是一个算法。我讲这个例子有一个特殊的原因,我们之前说人和计算机比计算没有可比性。假设 N 是一个很大的数,计算机从 1 加到 N,而人用高斯发明出的公式,谁会最早算出答案?还是计算机。


如果你同意这个的话,那我们再来谈一下 AlphaGo 。下棋包含两件事情,一件是算法,另外要去算才有答案。棋手下棋的算法来自自己,算也要自己去算;而 AlphaGo 的算法来自一个由人组成的团队,有几万台机器在云那边去算。


如果今天人用比较好的算法,还和机器有得一拼的话,你会觉得谁的算法比较好?肯定是人的算法大概比较好,因为机器的计算力比人高那么多。所以 AlphaGo 打败人,对 AI 来说不算什么,根本和创造力一点关系都没有。我觉得象棋也好、围棋也好,都是需要智慧的,人在这上面花时间是有意义的。


科学发展,肯定是新的算法,事实上新算法随处可见。比如说今天的出租车,该派哪一个车去;或者说快递公司在送快递的时候,我们说“旅行中的销售员问题”(Travelling Salesman Problem),先送这里还是先送那里,怎么去优化,这全都是算法。甚至于有些算法不是那么明显的,比如说教书,我们常常有这种经验,有一个东西你觉得最好的教法是这样,但是你这么教,有的学生可能就不能接受,有时候你换一个角度去教,他就可以接受,算法可以让人懂得更多事情。


去年美国大选,前年英国脱欧,我知道可能投某一方是对的,但是我这个票就是投不下去。很多时候我知道你是对的,同时我也愿意接受,甚至把票愿意投给你,或者叫做同理心等等,这个其实跟算法是有关联的,至于怎么变成算法,我还在思考。


最后提一下,创造力绝对不是大数据的问题,而是小数据的问题。我举一个例子,去年火起来的引力波是爱因斯坦在 100 多年前提出来的一个假设。当年不可能基于大数据,我觉得是无数据,因为 100 年以后我们用最新的设备才勉勉强强测到一点影子。他当时怎么想到这个东西的?肯定不是大数据。如果有大数据,我说有引力波,我相信一个小学生也可以做出来。所以,没有数据怎么产生创造力,我认为没有人知道。大家在比 AI 跟人的时候,不要忘记两点,第一点,今天所有的 AI 算法都是人写出来的。如果有人说我今天会写一个程序,跟用一个程序或者新的算法去解一个新的问题,这两者是不一样的。


我写一个程序,面对我知道的问题,能够做出解决方案,这就像下棋,加强学习就是这个例子。可如果我写出一个程序,能够解决一个新的问题,我都不知道这个新的问题是什么,这个新问题对照一个解法,这是没有的事。实际上 GPS(一般求解器),我们没有,我当然希望有一天有,但实在没有。


大家再看一下脑神经学和认知心理学,但至少大部分人相信,我们人的左脑、右脑所处理的事情不太一样。所以似乎计算机只是一个左脑,而我们的创造力大部分在右脑。右脑加左脑,其实本来就是一个大胆假设、小心求证的过程,所以我觉得 AI 和 HI 要结合在一起,更不要说计算机是我们发明出来的。


缺点碰撞创造力


智慧,我实在不知道怎么定义,我也觉得我没有资格去定义。因为我不能定义,我只能讲我自己到目前为止,我了解的东西跟智慧有关的,就是《倚天屠龙记》张三丰教张无忌太极剑法的故事。第一次张无忌说,太师傅,我这次记得了七成;太师傅说,很好,有进步;第二次张三丰又舞了一次,张无忌说,太师傅,这次我只看懂了一半,张三丰说很好;第三次张无忌说,太师傅,我完全不记得了,张三丰说,你融会贯通了。


我们再看看意识和想法。有一个镜子测试(Mirror Self Recognition Test, 简称MSR),我的理解是这样的:如果在你的额头上贴一个便利贴,你马上知道这不是属于我们的一部分,就把它拿掉,这是一个恶作剧——就是我能不能知道这个东西是我的一部分。我的理解,首先大部分的动物是不通过的,我们喜欢的狗跟猫基本上没通过,大部分的猴子也没通过,但是好像猴子经过一些训练以后是可以通过的。据我所知,海豚是通过的。


但是这个有争议,有人会说,有这种可能,它其实知道这不是它的一部分,只是它不觉得麻烦,所以没有拿掉。但我想自我意识不是每个动物都有的。另外一个是思想和身体之间的关系,笛卡尔说我思故我在。有一派是纯粹的唯物派,所以思想就是你的软件,硬件就是脑,要研究脑。有另外一派觉得不是,至少还有一个脊椎,思想和身体是一体的。我自己本人比较倾向于这一派。因为人有时候疼痛或者感觉,事实上是会影响我们的思维的。如果说只有脑的话,把身体拿走,其他地方的感官不影响思维,是不是这么简单呢?如果就是一个软件跟硬件的关系,那软件来自于哪里?有一本书,是认知心理学的书,它也做一些脑神经的东西,一个叫 Gelernter 的教授写的一本书,叫 Tide of Mind: Uncovering the Spectrum of Consciousness。他把一个人的头脑大概分成两个周期,一个叫 High Spectrum,就是通常我们起床喝一杯咖啡,我们意志力很集中的时候,可以做计算,做推理,做逻辑,做很精确的东西。Low Spectrum 就是我们累了,打哈欠了,做白日梦,甚至于就睡着了。意志力不集中,这时候你计算或者记忆就会失误,就会算错。这时候我们可以接触到深层的记忆,但绝对不充分也不必要。似乎这些东西跟创造力有点关系。我这里举了一个例子,贝多芬做第九交响曲的时候,他是全聋了,我们绝对不能说他是 High Spectrum。甚至于有一个化学家发现苯环结构的时候,他说他在睡觉的时候梦到一条蛇,自己咬到自己的尾巴,形成了六角形。


其实,人有高创造力的时候,并不是在意志力集中去想问题的时候,反而通常是在意志力没有那么集中的时候。不过,虽然想法很重要,但也要小心求证。中国也好、西方也好,很多诗人、作家常常喝得酩酊大醉,的确是意志力不集中,但创造力就出来了。


但是我觉得很好玩的一点是,我觉得人的缺点反而帮助了我们提高创造力。什么意思呢?就是人意志力不集中,经常会算错。但有人说这个简单,让计算机每十题故意算错一题,我保证这样的计算机也没有创造力。但是人的这种缺点似乎帮助了我们的创造力,这是一个很好玩的事情:因为人不完美,人的记忆会错,人会算错,但是我们在有缺点的时候,才会创造出很好的东西。


智慧,我们一般人认为人年纪越大,越可能有大智慧。人年纪越大,脑子是退化的,总有一天会死去,为什么智慧来了?我觉得这可能是源于人性。


本文系清华大学《脑科学与人工智能的对话》课程第三讲整理稿,转自微信公众号“知识分子”,原标题为“洪小文:以科学的方式赤裸裸解剖 AI ——人的智慧在哪里?”


了解更多:




后台入驻微软小冰

如果你很萌,请跟她一决高下!


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存