图灵困境：颠覆你所认知的“智能”驾驶

Original 2017-05-22 刘小贤 泰伯网

泰伯网

有看点的空间地理信息资讯都在这

你还在等什么？

我们试图创造人工智能，但我们连“智能”应是什么都不知道。

早在1950年，计算机之父阿兰·图灵提出图灵测试的概念：一个人和一台机器在被隔开的情况下，人向机器进行交流或提问。如果有30%的测试者不能确定他是在与人还是机器进行交流，那么说明这台机器通过了测试。他也大胆预测，在2000年的时候就会有机器人通过图灵测试。

图灵测试也试图解决一个困局：我们试图创造人工智能，但我们连智能应是什么都不知道。

在无人驾驶如火如荼的今天，无人驾驶车辆也势必面临着类似的“驾驶图灵测试”，正所谓——是骡子是马，拉出来溜溜。但是在此之前，我们必须搞懂，对于无人驾驶车辆而言，“智能”二字究竟意味着什么。

中国工程院院士、中国人工智能学会理事长李德毅认为，现在的“智能”更多的是针对感知的研究，而非针对“认知”的研究。无人驾驶也是这样，当自动化到了天花板，人工智能的“认知”就来了。

认知就要有记忆。记忆是脑认知的核心，一个成年人和一个小孩子开车，遇到障碍物的认知是不相同的。而成年人的认知，更多程度地基于记忆。相对应的，遗忘也是人类智能的显著表现，从记忆中删去无用的部分，即是为了更好地保存有用部分，也是对人脑的自我保护。研究认知，就要研究记忆和遗忘。认知还要有交互。熟练的驾驶员不依赖GPS就可以完成对自己的定位，这个过程就是驾驶员与世界的交互。而计算机也要完成对“上帝坐标”的交互，也要熟悉身边的环境。

拥有感知的无人驾驶车辆，不仅可以在道路上畅行无阻，还拥有驾驶个性，拥有驾驶记忆。会考虑如何驾驶能让让乘客免受颠簸，更加舒适，会选择哪条高速更加省油。

从感知到认知，从自动化到人工智能。智能驾驶先行一步，我们正在创造未来世界的“机器驾驶员”。而当机器导游、机器教师、机器医生……纷纷出现的时候，等待我们的是一个强人工智能时代。

到那时，也许人类集全部的智慧可以完成那个在计算机还像铁箱子的年代中，图灵提出的测试标准。而前路呢?

李德毅自信地说：那是一个后图灵时代，也是一个人机共生、共融、共发展的时代。

以下是演讲实录(未经本人核实)：

（5月21日在世界人工智能大会上的演讲）

李德毅：各位下午好，今天谈一谈智能驾驶，我讲一下智能车做好了怎么测，怎么使得它具有拿到驾照的水平，我报告的题目是无人驾驶的图灵测试。

图灵测试在人工智能时代再次被提上话题

脑科学、认知心理学、神经生物学形成了脑认知。而脑认知启发的人工智能是目前研究的对象。图灵测试就是用于对于这类人工智能的测试上。

做什么东西，得把评测搞清楚。怎么测，我们一直讲智能代理。智能代理或者认知它的方法是什么。图灵先生在他年轻的时候就在想这个事情，他提出了图灵测试，几十年过去了，人们已经把图灵测试研究透了，有人说图灵测试漏洞太多了，不好测。有人认为图灵测试做了很大的贡献，直到今天，人工智能经过两个寒冬以后，我们看人工智能带来的变化。

首先是脑科学，然后是认知心理学，接着是神经生物学。这三个学科对于人智能的启发更大一点，我们把这一块叫脑认知。脑认知启发的人工智能就是目前研究的对象，这一块按照图灵的说法，要拿对话来测试：用一个人和一个机器人在彼此隔绝的环境下对话，看看人类能否能区分它是人的声音还是机器的声音。听起来很简单，但是其中有多少“智能”呢?比如你回答问题的时候是否得体，交谈的时候带不带情感，你是沮丧的沟通，还是愉悦的沟通?所以这件事情并不那么简单。

1950年，阿兰图灵发布了一篇论文，其中可以看出，图灵测试的本质就是交互智能的测试。一直到2014年，聊天机器人尤金古斯特曼发布了。类似的交互测试有很多，比如做诗：给你一个上下联对横批，分别不出来是人做的还是机器人做的，是不是可以说这是图灵测试。还有比如一百万人同时写一篇文章，由机器人阅卷评分，这时跟人的阅卷有什么差别?怎样实时地交互来批改这个作文，怎么样打分，怎么样形成评语，才能达到以假乱真的程度?

但是现在的核心问题是，由机器人写作，写出来的是打油诗还是水平很高的诗，这个“智能”程度是怎么测试的?

因此，图灵测试又被提上了话题。尤其重要的是，最近全世界都在做智能驾驶，无人驾驶，驾驶驱动的图灵测试怎么测。如果我们在路上看到一台汽车，你是否分辨不出是机器人开的还是人开的?你是否分辨一个新手或者是老司机?是A驾照还是C驾照?图灵测试在后图灵时代已经进入了我们的生活。

谷歌公司是无人驾驶的领头羊，2015年就声称跑了100万英里，已经达到人类75年的驾龄。但遇到一个最基本的问题，就是无人车上路怎么样获得驾照?因此驾驶认知度量已经成为交管部门当务之急的问题。

对我们科技工作者来说，脑认知如何度量，这是一个非常重要的科学问题。假如我们把图灵测试的对象变成自动驾驶车辆，你区别不出是智能驾驶的汽车还是无人驾驶，那能不能叫图灵测试，如果测试者坐在直升飞机上，看交通流，车子往前走，你区别不出哪一辆车是人开的，哪一辆车是机器人开的，可不可以说就达到了人的水平呢。

但是无论是机器人对话，写诗还是自动驾驶，有一点必须坚持：那就是允许测试者现场监督和交互。测试者可以现场改变红绿灯，看看车能不能停下来;可以制造一个汽车障碍，看看能不能避障;现场介入的交互是必须的。同时也要考虑一个情况：我们驾照路考的时候，同样两个人，水平差不多也很有可能一个人拿到驾照，另一个人没拿到。因为有可能考官对一个人说，“你刚才超车的时候头没有往后看，我们规定头要往后看的，所以本来应该下次再考，但是你态度比较好，你记住这件事，这一次给你过了就可以了。”因此我们认为图灵测试本质上尽管存在客观性，但是必然带有主观性，如果一个驾驶员老不合格，这就会受到质疑，何况驾照还可以收回，所以对图灵测试也应该用这样的观点来看。

驾驶图灵测试的现实意义非常重要。汽车工程学会有一个自动驾驶的等级区分，分成L0到L5。有的厂家宣称我要做L4的自动驾驶，有人说我只能做L3，我觉得辅助驾驶挺好。所以有一个问题，就是图灵测试的问题。自动驾驶的等级转换点如何度量，掌握权交界点如何度量，5级分类可操作点在哪里，要规定100个驾驶窗口还是1000个驾驶窗口，这还真是一个问题。

我们在北京可以看到很多特斯拉的车，有的卖80万，有的卖120万，但是问驾驶员实现自动驾驶了吗?驾驶员都会说基本上没有。因为特斯拉声称是L2等级的自动驾驶，也就是需要驾驶员的手放在方向盘上，保持注意力。如果不这样干，出了事故还是驾驶员的责任。所以图灵测试的问题是一个现实的问题。

拟人过程中的三种认知

我们的观点和特斯拉不一样，和谷歌有区别，和英特尔也有不同，我们认为八个字，无人驾驶，难在拟人。无人驾驶不仅仅是车，不是做自动化就可以了，自动化遇到了天花板，人工智能来了。

人的智商到底是怎么样表现的，生物学家告诉我们，在微观，宏观维度上有不同的表现。比如说看到一个词汇和听到一个词汇，人的兴奋区和兴奋度都会不一样。所以告诉大家，所以告诉大家，记忆很重要。一个驾驶员头脑里记录了多少场景，能够应付多少事件，怎么学习的，这点很重要。

当人看周围场景的时候，驾驶员是有选择性注意的：同样一个场景，小孩子和一个经验驾驶员看，注意点是不一样的。我们很多人都做机器视觉，有人说是计算机视觉，确切说是图像的处理和理解，我们叫做先视后觉。它无特定的任务驱动，所以我们进行分类，聚类，进行一些识别，形成一个全局的认知，现在很火。但是人类认知难道都是这样的吗?不是的，因为我们在做无人驾驶的时候，有一条坚定的信念，也是我们确定的一条原则，叫做传感器不完美原则。不要想着哪个传感器是完美无缺的，分布在车体各部位的传感器都认为看到了全局。

生物视觉和机器视觉的差别，视而不觉，无视后觉，边视边觉，先觉后视。在生物视觉选择性注意当中，我们经常听到，大范围优先，或者大尺度有限，当你看一幅图的时候，大图很重要，细微的地方并不重视。另外，当你看到一副图像的时候也会存在差异优先。我们的问题是，在选择注意力的时候，这几个问题碰到一起到底谁优先?我们研究的结果认为，真正的是记忆优先，你头脑里记忆的东西对当前情景的优先选择会发生很大的影响。

现在很多人研究感知的智能，没有人研究认知的智能。而我们就在研究认知的智能。脑认知主要表示在如何听、说和如何看，而脑认知的内涵是想，想的时候有三种认知，计算认知、记忆认知和交互认知。我曾经在一个场合说过一点计算机负面的话，就是我们人类对计算机的追求有一点贪得无厌，计算速度现在这么快，我们还要更快。但是我们没有用精力研究记忆和交互，这是一个遗憾。我们在研究计算的同时，应该花更多的精力研究记忆和交互，这才是受脑认知启发的人工智能。

我们认为人类的认知没有想象的那么复杂。将一句话，一件事反复地装进你的头脑里，你就形成了自己的认知。记忆是脑认知的核心，遗忘是人类智能的显著表现，没有遗忘脑子将不堪重负。神经生物学家告诉我们，人类记忆是分区的，瞬间记忆，工作记忆，场景记忆，有不同的划分的区域和方法。遗忘是对记忆的不能再认和回忆，因此我们应该研究遗忘、记忆、存储。认知过程可以用卷积表征体现出来。

我个人定义了一个很重要的公式：记忆是认知函数和遗忘记忆的卷积。我提出用认知学的物理方法研究人的遗忘，一个图片怎么实现遗忘过程的，在你的记忆里又是怎么恢复的，这件事情应该下决心研究清楚。记忆通常是非常丰富的，但是也是瞬间的，记忆是在海马体里面，它和学习有很大的关联。大脑的皮层的记忆已经被抽象化了，所以人工智能的学者不能简单研究计算，还要研究记忆，不但要研究学习和遗忘，还要研究三个不同记忆区的划分方法。要研究工作记忆和场景记忆，怎么样帮助当前的瞬间感知。人脑的计算没有什么复杂的变化，就是一种相似计算，是我们复杂化了。

交互是脑认知的重要形态，交互的力度不一样，各有各的不同，怎么样实现转换。人在与神经网络交互的同时，还有与外面世界的交互，获得心得感知，所以交互具有二重性。对于无人驾驶来说，你要回答人的驾驶认知过程中必须回答的问题，就是人脑是如何定位的。

大家都知道，做无人驾驶最难的技术，就是实时定位，我们把大的坐标系叫做上帝坐标系，每个人看的都一样，我们的智能体是以它为基础的认知，因此我们提出对周边环境进行实时定位以及映射，这样才能知道我这辆车当前应该在什么地方，应该采取什么动作。而语言我们认为是图像认知在不同抽象中的语义标注。要构造不同尺度连接组的，三位一体的多个多层的卷积网络。

这时候我们看看计算机的局限性，计算机最主要的是CPU，脑认知的单元每层都有记忆智能，计算智能和交互智能，这样才能建立起来。我们的观点和特斯拉不一样，和谷歌有区别，和英特尔也有不同，我们认为八个字，无人驾驶，难在拟人。无人驾驶不仅仅是车，不是做自动化就可以了，自动化遇到了天花板，人工智能来了。

让驾驶脑具备个性

不同的人开车行为习惯不一样，我们认为自驾车应该有个性，好像我们每个人开车都有个性一样。驾驶技能的习得通常通过认知，关联，自主三个因素决定。

我们有一点感叹，现在的汽车可以做到100马力甚至更高，但是汽车在认知方面还不如马。马是认知主体，老马识途，车不如马，现在无人驾驶遇到最大的痛点就是最后一公里，回不来。

共享单车回不来，将来共享汽车，最后一公里回不来，共享汽车的商业化用途就无解。因此，要想实现无人驾驶为主的驾驶，最根本的问题到底是解决车还是解决人，我们发出一点不同的声音。如果做解决车的问题，就把车的自动化做好，我们做一个软件定义的机器来实现无人驾驶。如果解决人的问题，那就必须具有记忆，决策和行为能力的认知主体来进行自主驾驶。

一字之差，差之毫厘，自动化学者和人工智能学者是有不同的观点的。汽车的行为是由驾驶员决定的，无人驾驶难在拟人，因此我们要研究驾驶员行为学和驾驶员心理学，当在爆胎的时候，驾驶员的动作恰当吗，我们要研究驾驶员的感知、记忆、控制和行为技巧，而不是一味的改良车辆动力学性能，实现自动驾驶。

我们看看驾驶员的行为学和心理学，过去在交通运输领域就有专门研究驾驶员的行为学和心理学，分为感知域，认知域，行为域。现在我们在做认知领域的深度学习，驾驶认知的核心是学习还是记忆，生活是记忆，驾驶也是记忆，驾驶员开车的时候都是在“算账”，所以记忆很重要，每次驾驶都会结合对过去驾驶的记忆。

学习是什么，学习是理解知识，形成记忆的交互过程，理解是信息的认知或已有认知的结果，而记忆弥散在神经网络之中，不去研究这样的问题，做出的决策和结果出路不大。驾驶员的经验和临场处理能力必须由驾驶员自己替代。我们现在开始往记忆和交互上发展，计算、操作系统ROS固然重要，但是它不能代表驾驶员。

如果要说驾驶员的注意力，释放驾驶员的认知，必须有一个物化驾驶员的认知，我们把特定的驾驶认知叫做驾驶脑，这样以来就会注意力集中，永远专注，永不疲劳，原来驾驶员发生的事故称之为人类第一杀手，也就不再存在，这该多好。

驾驶认知，自动驾驶是机器驾驶，它物化了驾驶员的认识，实现了无人驾驶。我们想一想，自动驾驶如果是在地铁比较好，因为铁路是固定的，还有网络调度。高铁也可以做自动驾驶，因为道路是封闭的，调度能力很强，飞机也可以做自动驾驶。唯独汽车不行，因为汽车是个人的代步工具，它在开放的不确定性的环境下，常常会遇到大雪、大雾、大雨。还比如红绿灯失效，道路施工，车辆醉驾等等，如果不能处理这些情况，自动驾驶可能难以胜任。

有经验的驾驶员，标杆驾驶员能够灵活处置，但自动驾驶车辆怎样学习呢，这是我们研究的重点。一个小孩能够成功的抓住一只球，这是计算出来了吗，不是。是用了什么算法吗，也不是。一次又一次的学习，操练，久而久之，智能成为新的本领。我们认为开车和学英语本质上是相同的，熟练的司机开车，如同自己走路一样自然，开多了，不是每天都在计算。有经验的驾驶员，不但要符合驾规，安全行驶，我们还要使车子坐起来比较舒服，从A点到B点怎么样舒服省油，这也是驾驶员重要的技巧。

因此我们发明了一个单词，Driving Brain，不同的人开车行为习惯不一样，我们认为自驾车应该有个性，好像我们每个人开车都有个性一样。驾驶技能的习得通常通过认知，关联，自主三个因素决定。如果像特斯拉一样，把传感器放在车里，让人工开车，开了两年以后，拿回来一学习，再放回去让它和你开车一样。在路上的行为就成了自己的行为，人的感知和车的行为达到了合一的境界，这是我们追求的目标。

我们十多年的自动驾驶的生涯告诉我们，这件事情很重要，如果没有的话，我们仍然会恐慌、迷茫，今天做的很好的，明天可能就做不好了。感知认知和行为有一个比较好的反馈过程，从动态感知到态势分解，到自主决策，这个期间场景记忆，功能记忆都起到很重要的作用。

四类传感器，分别是激光雷达，摄像头传感器，车姿传感器，还有GPS传感器，这代表我们的感知系统。认知系统里，既有驾驶技术，还有各种各样的记忆棒，我们利用当前的驾驶态势和时间序列表决策当前的认知，形成认知箭头，控制车的动力和行为，这块叫做小脑，因为它已经有驾驶技巧了。

从感知到认知到行动，我们2016年研发驾驶脑V1.0。原来开始开车准备时间十几分钟，现在我们开车启动时间只要22秒，我们终于开始我们自己的发明，就是驾驶脑，它是给你拿驾照的，它是给你积累驾驶技能的，它是买路熟的，它是个性化驾驶和标杆驾驶。这些东西怎么靠自动驾驶完成的呢，这就是我们在全世界自动驾驶的浪潮中发出的自己微弱的声音。

我们认为人工智能的使命是加速汽车向人机交互的转变。有了驾驶脑，有可能使汽车成为驾驶员自己，这是我们人类追求非常有理想，有意义的科技，我们很多人买聊天机器人，我们想汽车也应该是这样的。智能驾驶专用实验与评估环境，全国已经批准了7个实验场，这很有可能发展成为赛车手和赛车机器人的赛车场。

机器人换人带来一个新的行业，就是后图灵时代。也许是人机共生，共融，共发展的时候了。如果人脑的域的认知能力可以先局部地得到解决，比如驾驶问题，写作问题，学英语问题等。如果在一个流动大巴车上，我们安排一个驾驶脑，安排一个聊天脑，不但会开车还会导游。慢慢发展下去，千千万万个特定的机器人认知脑，通过移动互联网，云计算和大数据，是不是可以倒逼变成一个通用的人工智能呢或者强人工智能呢?我们一起来拭目以待。

在无人驾驶的未来，车辆具备“智能脑”，既要与环境交互，也要与其他车辆交互。互联互通，以此为基础，城市的交通问题也会得到很好的解决。要解决交通问题除了依靠车联网，还要依赖智能交通系统中的管理规划、流量预测和分析、以及与互联网、大数据技术的相互配合。在WGDC2017的空间大数据+智慧交通峰会上，我们将在这里与您共话智慧交通的未来。

助理编辑：刘小贤

科班出身，编辑部稀有动物男编辑之一。

现聚焦智能驾驶领域。

End

扫描下方#二维码#

铁粉票，最！后！一！波！

等你来抢

深入阅读｜点击图片或标题

继国土三调技术试点消息发布之后, 问题来了！

上月热文回顾

⊙ ofo决定采购北斗定位服务，合众思壮等5家企业获益

⊙ 雄安新区的秘密测绘概况