微软、特斯拉、百度也要服了,这张图值600万元美金!自动驾驶难量产的“定时炸弹”终于找到了!
最近,互联网思想最新发布,“钢铁侠”崩溃!马斯克哭了:“是我傻X,太信机器人了!”去中国很有必要,但……,北京时间8月25日上午消息,据彭博社消息,马斯克在特斯拉官网上发布公开信称,特斯拉将放弃私有化。
8月23日上午消息,首届中国国际智能产业博览会上,中国人工智能学会理事长李德毅指出,自动驾驶车的量产举步维艰,最重要原因在于线控的制动,这是量产自动驾驶的“定时炸弹”。此外,真正的无人驾驶汽车不仅是自动,更应该是自主。
李德毅在演讲中分享,三年前我在一个学术会议上讲了我们的技术方案,讲的是一辆无人驾驶车,在不同的车载传感器下,在传感器的支持下,怎么样形成一个驾驶态势图,这个驾驶图怎么形成一个区域,怎么用人的头脑长期记忆构成一个驾驶判断,最后形成对方向盘、油门和刹车的控制动作。我记得微软的副总裁在我作这个报告的时候,他说:“老李,你这张图值600万元。”我现在把这张600万美元的图贡献给大家,看一看我做的驾驶图是多么不同,我们这里面不但有计算,更有记忆,我们不但有瞬间记忆,还有工作记忆和产品记忆。
另外,8月23日上午消息,首届中国国际智能产业博览会上百度公司创始人、董事长兼CEO李彦宏最新演讲:人工智能长得不应该像人跑步,但要让机器能够像人一样思考。他也特别提到:“李德毅院士也讲了,自动驾驶其实还有很多技术难题没有解决,我们今天看到的所谓的这种智能,很多时候还是假的。”
互联网思想特地找到李德毅院士的图:
李德毅院士:
“驾驶脑”是AI时代自动驾驶汽车的关键
来源:厚势 (微信号iHoushi)
在 2017 中国人工智能大会(CCAI 2017)上,中国工程院院士、中国人工智能学会理事长李德毅发表了主题为《L3 的挑战与量产》的演讲。从「L3 难在哪里?」、「如何突破 L2 的天花板?」、「量产 L3 的策略」三个方面出发,重点讨论了当前 L3 自动驾驶汽车所面临的挑战以及量产问题。
中国工程院院士、中国人工智能学会理事长李德毅
在此次演讲中,李德毅院士谈到了 L3 级别自动驾驶的难点,以及从 L2 向 L3 过渡过程中需要考虑的重要问题。他认为一定要界定清楚 L3 的基本问题到底是要解决车的问题,还是解决人的问题。
此外, L2 到 L3 的过渡是掌控权由人到机器的转移过程。就此,李德毅院士提出了以下三点质疑:
自动驾驶等级转换点如何度量?
掌控权交接点如何度度量?
掌控权交接过程中的事故如何度量?
以下内容根据李德毅院士本次主题报告整理,略有删减:
一、L3 难在哪里?
目前,几乎所有上路的自动驾驶汽车都还处在 L2(部分自动驾驶)等级,包括特斯拉在内,都需要由人掌控。而最近奥迪已经宣布 8 月底将要发布 L3 量产车,这是全世界第一家量产的、「有驾照」的车,对驾驶行业意义重大。从 L1(人工驾驶)到 L2(部分自动驾驶),再到 L3(机器自动驾驶),固定驾驶员的角色将不复存在,而原先为人服务的 LBS 也为无人驾驶开辟了新的战场。
在整个行业的驱动下,无人驾驶车不再只是高等院校和研究所的事情,目前已经开始走向企业和普通人,这时量产就非常有意义了。但在此之中,量产涉及到规模、可靠性和价格等因素,并且,从整体上梳理 L3,我们也需要思考以下几个问题:
用户为什么会买这款车?
市场容量大吗?
国产的 L3 企业在哪里?
如何界定 L3?
L3 是区分以人为主和以车为主的驾驶方式的分界线。L3 级别是车辆拥有驾照,不再以人有驾照作为基本要求。下图中蓝色是以人为主,绿色是汽车自驾为主。
在此之中,最难的是从 L2 到 L3,鉴于驾照发放(交管)和车辆管控(工信部)的因素,让 L3 上路还不是件容易的事。
自动化行业提出一个「自动驾驶+智能网联」的解决方案,即:
结构化道路
确定性窗口
网络协同
软件定义的机器
假如让软件来完成自动化的操作过程,基本上汽车人都是走这条路。对于用户来说,L3 是社会对自动驾驶要求的底线,拿到驾照是最基本的要求,将来如何度量还未可知。
对于跳过 L3 级别,直接做 L4、L5 的汽车厂商来说,这个度量并不好掌握,尤其是掌控权交接过程中出现事故这种情况,要如何处理呢?比较糟糕的是,越是信任自动驾驶,越容易造成驾驶员注意力不集中。这种情况下该如何分担事故责任呢?
从 L2 到 L3 的过渡,是掌控权由人到机器的转移过程。这里面有三个疑问:
自动驾驶等级转换点如何度量?
掌控权交接点如何变度量?
掌控权交接过程中的事故如何度量?
在 J3016 标准中,明确了驾驶掌控权由人转移到车,跳升的界定很明确。
二、如何突破 L2 的天花板,进入 L3?
光靠自动化解决不了无人驾驶,于是人工智能来了。汽车绝不是四个轮子加一个手机,我们人工智能工作者要对汽车人心存敬畏,开过好车的就知道汽车的人机设计非常好。
汽车是在开放的不确定性环境下行驶,人工驾驶常常会遇到偶发的事件,「常常」就是概率比较大,「偶发」就是概率比较小,一个驾驶员遇到这样的情况是必然的,什么情况呢?大雾、大雪、大雨、大风、狭小胡同、崎岖小道、傍山险路、积水、冰雪、地裂以及地陷;红绿灯失效、道路施工、行人违规、以及熙熙攘攘农贸集散区等通行状况。连新手驾驶员都难以完成这些驾驶任务,而有经验的驾驶员往往能够灵活处置,那么自驾车如何应对呢?
在道路狭小的地方,如果一个无人驾驶遇到有人驾驶车,怎样办?一旦突破了自动驾驶所设置的窗口条件,如地理栅栏、气候栅栏、以及人文地俗栅栏,马上需要进行驾驶掌控权的交接。在这样的交接过程中的事故也许比纯粹的人工驾驶更危险,因此汽车拿驾照不是容易的事情。
L3 的基本问题到底是要解决车的问题,还是解决人的问题?
车子的问题就是把车越做越好,做成软件定义的机器。而人是指把驾驶员的认知用机器人替代,要具有记忆能力、决策能力和行为能力,要实现自主驾驶,不但有技巧还要有个性。
汽车是从马车演变而来的,现在的动力可以达到 100 匹马力,但汽车远远不如马在不同负荷、不同天气、不同路面状况、不同车辆情况下的适应能力。汽车的感知、认知能力远不如马这个认知主体,老马识途,车不如马。在自动驾驶过程中,驾驶员和周边车辆的交互认知哪里去了?驾驶员的经验和临场处置能力由谁来替代?
重要结论:自动驾驶好在专注,传感器不会疲劳,但是自动驾驶难在拟人,不仅在车。驾驶员脑不等于驾驶脑。
人在回路中的预测与控制被驾驶脑取代
驾驶过程中,驾驶员在回路中的预测与控制是汽车自身无法替代的。轮式机器人驾驶脑应运而生,它不同于雷达等传感器的感知,要去完成包括记忆认知、计算认知和交互认知在内的驾驶认知,成为智能车产业化链条中的重要零部件,车载机算机和机器人操作系统也无法替代。
记忆、计算和交互同样重要。计算机的计算能力已经超过人的能力,要把注意力转移到记忆、计算以及交互上,靠一个车的计算机无法替代驾驶脑。
利用微电子技术,采用 CPU+GPU+PFGA+ASIC 架构,生产专用芯片和板片,研发驾驶脑。
通过雷达传感器、视觉传感器,车姿传感器以及定位传感器这四个感知通道,形成认知的态势图。这个形成以后,对数据的需求就会大大减少。
驾驶就是记忆,驾驶不是靠计算的,要强调记忆认知、交互认知和计算认知。
上图中驾驶员记忆分三个区:瞬间记忆、工作记忆以及场景记忆。
创新:驾驶脑
驾照:传感器替代不了,车厂替代不了
驾驶技能:驾照替代不了
路熟:地图替代不了
个性化驾驶和标杆驾驶
经验驾驶员和标杆驾驶员
经验驾驶员不但要符合驾规,安全行驶,文明行驶,其经验还体现在节能技巧、驾乘舒适性、对不同动力学的车辆适应性等方面。世界上驾驶员的经验和行为,如同人的行走姿态,各个不同,可用驾驶行为作为驾驶员的身份识别,称为驾驶指纹。标杆驾驶员是经验驾驶员中的杰出代表。
智能车研发的困难,不仅仅是汽车动力学的性质和各种各样的传感器要求,更重要的是要研发和驾驶员一样的在线的机器驾驶脑,模拟实现人在回路的自主预测和控制,应对车辆行驶中的不确定性。
驾驶指纹和开车目的地无关
集图灵奖、诺贝尔经济学奖和美国心理学会终身成就奖于一身的人工智能早期学者赫伯特·西蒙(Herbert.A. Simon)的工作启发了我们,有了线控、数控汽车,通过深度学习,挖掘驾驶员对方向盘、动力踏板、制动踏板的驾驶行为大数据,就可以判断并获得特定驾驶员技巧的个性。驾驶技巧和开车目的地无关。
驾驶脑有个性,有在线学习能力,记忆许多驾驶事故的预防应对,还能和乘员聊天,和云上的驾驶超脑交互......
传统汽车仅仅是驾驶员的手、脚和力量的延伸,控制车辆行为的是人,线控汽车装备了传感器以后,用驾驶脑替代驾驶员认知,并获得驾驶指纹和驾驶技巧,使得汽车成为驾驶员自己,或者说让机器成为自己,应该是人工智能时代最有意义的问题之一。不同的驾驶脑,认知水平可以有差异,技巧和经验也可以有不同,但都具备了基本的驾驶认知能力,获得了驾照的自驾驶。有个性、有在线学习能力,有很多驾驶事故的预防应对能力,尤其重要的是我们还要关心驾驶超脑。
三、量产 L3 的挑战
截止 2016 年底,中国产销汽车超过 2680 万辆,汽车保有量 2.79 亿辆。对于自动驾驶:
我觉得不必把全球所有地域的道路状态,都压在一款特定的车型上,这很重要,否则跑多少英里也不能拿到驾照。不必把所有的认知放一个驾驶脑里面。先做园区观光车、通勤车、巡逻车、无人泊车、定点物流、校车、定点接驳、快速公交等。这些场景下,自驾车能否取代驾驶员掌控,取决于能否处置特定场景下的意外情况,能否发出求助信息要求人工敢于,或者在迫不得已时做出最小损失的策略。
无人泊车是绕不过去的
从当前的代客泊车市场预估无人泊车,有很大后装市场(百亿元规模)。泊车通常是怠速状态,四轮轨迹差异大,体现车辆动力学。泊车工况多样,手脚并用,繁忙切换,考验小脑,考验驾驶技巧,难搞定;可模拟多种多样艰难泊车环境,但用地不大。
大数据开车
未来汽车会成为大数据的源泉,移动社会的传感器,驾驶脑有学习和自学习能力,技巧和经验可以在线提升,驾驶脑智能的进化速度超过自然人,尤其是群体智能发挥驾驶超脑的作用,这样汽车制造商逐步地成为汽车运营商。随着 L3、L4 级别车辆的出现,L5 级别的自动驾驶车迟早也会实现。当人们对 L3、L4、L5 的差异不再介意时,这个世界就变了。
从特定的应用环境寻找量产 L3 着手,人类摆脱了驾驶的羁绊,开始享受移动办公和移动生活,逐步推广到更高车速、更加复杂的道路场景、更多不确定性天气气侯下的自动驾驶。
最后以一句话总结今天的发言,那就是——人工智能以润物无声的柔软改变着整个世界。
李德毅:自动驾驶难量产的“定时炸弹”终于找到了!
“信息化时代我们有五个小兄弟”,李德毅称,第一是讲的电子工程,微电子、光电子;第二是通讯,网络、互联网、移动互联网;第三是计算机科学和技术;第四是控制科学和工程;第五是人工智能。“与前四个兄弟相比,AI还够强大,但是它有赋能的作用,他和通讯交叉、计算机交叉,导致了智能控制、计算智能以及智能网联”。
李德毅称,现在的汽车大概在“五兄弟”的驱动下发展。大家都在讨论未来属于自动驾驶,“但我提出来几点质疑,自动驾驶的时候,遇到了人不能处置的问题,控制权如何交接?在交接的过程中责任事故又由谁来认定?”
李德毅认为,现在所讲的自动驾驶,包括中国的特斯拉等,强调的是确定性窗口,但是越是自动驾驶,人们就越容易造成注意力不集中,因此全球几千万英里的路测依然难以获得驾照,交通部门正在研究路测的驾照和车辆驾驶员的驾照不同,所以,自动驾驶车的量产举步维艰,“特斯拉仍然还在说他是辅助驾驶,这里面最重要的问题就是线控的制动,成为量产自动驾驶的一颗定时炸弹”。
他说,在人工智能时代,真正的无人驾驶汽车不仅是自动的,更应该是自主的,它应该像驾驶员一样具有学习能力,能够应对各种必然的路况,“自主驾驶难在不确定性驾驶,我们叫做边缘驾驶。要把最后一公里问题当做最先一公里来解决,否则老百姓不敢坐你的车,如果你解决不了,对不起,老百姓不放心”。(新浪科技 韩大鹏)
以下为李德毅演讲实录:
各位领导,各位专家,各位朋友,我想跟大家说一说我眼中的未来汽车是什么样子。大家知道,科学技术是第一生产力,重庆市去年电子信息产业占了5000亿的产值,汽车又占了5000亿的产值,加起来就1万亿。那么在今后的二三十年之内,这1万亿的产业格局将发生什么样的变化呢?我想先讨论第一个问题。
未来已来,我说的是智能时代来,过去未去,我说的是信息化还未过去。自动驾驶成为全球的风口,全世界都在做这件事,从科学技术的发展史来看,一百多年的汽车发展,经过了技术的改造,到今天我们在哪里?2018年我们在哪里?我认为大概在这个地方,也就是说信息化时代还没过去,智能化时代已经到来,正好在两个交接期,在这个时候我们应该怎么办?
简而言之,在信息化时代我们有五个小兄弟,第一个兄弟就是讲的电子工程,微电子、光电子;第二个就是讲的通讯,网络、互联网、移动互联网;第三个讲的是计算机科学和技术;第四个讲的是控制科学和工程;这当中第五个小兄弟才是人工智能,当前我们还在信息化时代,跟这四个大哥哥比,小兄弟还不那么强大,但是他有赋能的作用,他赋给电子工程、光电子工程、微电子工程,造成一个最响亮的单词,叫做“智能芯片”,他和通讯的交叉、和计算机的交叉、和控制的交叉,导致了智能控制、计算智能以及智能网联。
所以现在的汽车大概是这五个驱动的要素下迅猛发展,全球都很火,火到什么程度?简单说就是在“烧钱”。无论是传统车企,还是造车新势力,还是互联网企业,还是新兴行业,像顺丰、滴滴他们大概算新兴行业,还有大量创新创业的青年们都看好这个方向,乐此不疲。尽管知道是红海,仍然往海里跳。什么原因?
在这个过程中我们不得不提到全球汽车工程师协会给了我们一个标准,他提出自动驾驶可以分这样几个登记:L2、L3、L4、L5,是我们正在追求的方向,或者把手离开方向盘、或者眼睛离开前方、甚至把注意力都离开,甚至不要驾驶员,这样一来全世界都在说自动驾驶,因为智能控制太火,过去还没有去。在这里我成功打上一个问号,将来的汽车真是这样吗?我提出来几点质疑,这个质疑就是自动驾驶的时候,遇到了人不能处置的问题,控制权如何交接?在交接的过程中责任事故又由谁来认定等等。
因此作为一个人工智能的工作者,对这个全世界都认为的技术路线,叫做感知、决策、控制提出了一点不同的认识,难道自动驾驶就是把各种创造条件符合的模式叠加起来,就可以自动了吗?有多少个N才能让我们老百姓坐上一个放心的无人驾驶车吗?N要等于多少呢?一千、一万吗?
大家知道,现在大家讲的自动驾驶,包括马上要进中国的特斯拉,强调的是确定性的窗口,软件定立的机器,以及结构化的暴露,以及人、车、路之间的协同,真的是这样吗?自动驾驶加智能网联能解决问题吗?我们要打上一个大大的问号。越是自动驾驶人们就越容易造成注意力不集中,因此全球几千万英里的路测依然难以获得驾照,交通部门正在研究路测的驾照和车辆驾驶员的驾照是不同的,什么时候能拿到这个驾照呢?尤其是自动驾驶车的量产为什么如此举步维艰?特斯拉仍然还在说他是辅助驾驶,这里面最重要的问题就是线控的制动成为量产自动驾驶的一颗“定时炸弹”。
我们要分析自动驾驶不能干什么?现在的车作为体力的延伸器,现在汽车的自动化遇到了天花板,什么能帮忙呢?人工智能来了,一个真正的无人驾驶汽车不仅是自动的,更应该是自主的,它应该像驾驶员一样具有学习能力,能够应对各种必然的工况。科学技术的发展已经从认识客观世界、改造客观世界进入到认识人自身的阶段。
机器人将成为人类认知自然与社会、扩展智力,走向智慧生活的重要伴侣,汽车对一个人工智能工作者来看它就是其中的一种轮式机器人而已,它不但应该像人类一样改变我们的出行方式,还应该改变人类的生产活动、经济活动和社会生活,所以重庆的这两个5000亿如果往这个方向走前景很大,智能产业蓄势待发。
我们看看如果再过20年、30年,按照我们国家人工智能的发展规划,中国的人工智能要占领世界的高地,这时候我刚才讲的智能控制、智能芯片、智能网联以及智能计算已经成为成熟的技术,给我们强大的支持,人们会更多关心人工智能本身的技术。
那人工智能本身有什么技术呢?未来的汽车应该是一个会学习的轮式机器人。人类走过了农耕社会、工业社会、信息社会,将走入智能社会的时代。人和轮式机器人不仅仅是控制和被控制的关系,更应该是教和学的关系、交互和协同的关系,我非常赞同刚才领导说的一句话,人工智能重要在人、为人服务。
人和轮式机器人在一起的工作会有几种工作状态呢?我们可以做一个浪漫的遐想,首先人开车,机器学习,你开你的,我把传感器放在车上,你说你开了三个月,我悄悄学会了。第二件事是机器人开车,人监控,那就是L2,当你不能做的时候我帮你忙,我们可以叫做增强学习。第三个阶段机器人开车、机器人自己学习,我们叫做净化学习。还有一个很重要的,就是我机器人教你开车,我是教练,你人是作为我的教练对象,这样一来全国各地的驾校就要失业了。我是这样看人与机器人的四个状态。
我希望我们的轮式机器人应该会开车、会学习、会交互、有个性、有悟性,这叫做“三会两有”,它不是一个自动化的控制工具,轮式机器人的重要部件有三大块:第一块就是需要一个灵活的腿脚,如果没有一个灵活的腿脚,IT行业是很难做过去的,我们把它叫做“肌肉机器”,就好像一个体操运动员翻了几个跟头,最后定在那里不扣分,什么原因?因为肌肉的功能。第二块是强大的心脏,新能源,这叫动力机器。第三块尤其需要智慧的大脑,我在最近几年就做了一件事,研究了一个“驾驶脑”,我申请了一个商标叫做“驾驶脑”,已经获得批准,要把一个驾驶员关于驾驶这块的知识放在一个物理的盒子里。
我希望我们的轮式机器人应该会开车、会学习、会交互、有个性、有悟性,这叫做“三会两有”,它不是一个自动化的控制工具,轮式机器人的重要部件有三大块:第一块就是需要一个灵活的腿脚,如果没有一个灵活的腿脚,IT行业是很难做过去的,我们把它叫做“肌肉机器”,就好像一个体操运动员翻了几个跟头,最后定在那里不扣分,什么原因?因为肌肉的功能。第二块是强大的心脏,新能源,这叫动力机器。第三块尤其需要智慧的大脑,我在最近几年就做了一件事,研究了一个“驾驶脑”,我申请了一个商标叫做“驾驶脑”,已经获得批准,要把一个驾驶员关于驾驶这块的知识放在一个物理的盒子里。
自主驾驶难在不确定性驾驶,我们叫做边缘驾驶。要把“最后一公里问题”当做最先一公里来解决,否则老百姓不敢坐你的车,自主应对驾驶过程中常常遇到的,但又是偶发的这种情况,如果你解决不了,对不起,老百姓不放心。
“驾驶脑”是驾驶员的智能代理,作为一个无人驾驶车不单单是车的问题,还要考虑人的问题,要把人的智能变成一个驾驶脑,这里面涉及到计算、智能,更多涉及到记忆智能、交互智能,它能够学习并替代驾驶员的驾驶认知能力,能够积累他的驾驶技巧。只有这样,我们的道路才能够变得平坦一点。
三年前我在一个学术会议上讲了我们的技术方案,讲的是一辆无人驾驶车,在不同的车载传感器下,在传感器的支持下,怎么样形成一个驾驶态势图,这个驾驶图怎么形成一个区域,怎么用人的头脑长期记忆构成一个驾驶判断,最后形成对方向盘、油门和刹车的控制动作。我记得微软的副总裁在我作这个报告的时候,他说:“老李,你这张图值600万元。”我现在把这张600万美元的图贡献给大家,看一看我做的驾驶图是多么不同,我们这里面不但有计算,更有记忆,我们不但有瞬间记忆,还有工作记忆和产品记忆。
我们把认知作为一个攻关的难口,我们不同于特斯拉的自动驾驶车,也不同于谷歌的感知智能,也不同英特尔和英伟达的车载计算机,我们体现计算认知,更体现记忆认知和交互认知,突出自学习能力,可以适应不同的车辆平台,智能驾驶将具有广阔的前景。
轮式机器人将成为移动社会的传感器、大数据的重要源泉;轮式机器人驾驶认知的进化速度将超过自然人;边缘计算和云计算一同产生群体智慧。我们希望:驾驶脑和驾驶超脑,不仅是中国的,更应该是世界的!
当前全球有70亿人口20亿辆车,中国的汽车保有量大概是2.8亿辆,年产新车1亿辆,一旦量产自主驾驶车上路,且占比越来越大,驾驶脑成为汽车必配,驾驶数据和智能越来越累积,驾驶脑越来越聪明,人类的出行方式就真的变了。
所以,我用这么一句话来作为我的结束,那就是:21世纪最具颠覆性的技术当数无人驾驶。这1万亿的产值机遇在重庆,大家应该抓好,谢谢大家!
【CICC年会专题】
李德毅院士:智能驾驶中的自学习——数据定义的软件
(根据李德毅院士在第四届中国指挥控制大会报告整理)先讲两个跟车相关的事情。一个是国内两起大巴事故,在湖南撞车燃烧,在天津爆胎坠河,共死亡50人,人类驾驶事故将促进智能驾驶快速落地。第二个事情是自动驾驶的特斯拉高速撞车致死,这也是自动驾驶致死的第一个案例。我们可以作为一个分析,相机将大卡车白色车体误认为白云,缺乏常识知识;特斯拉高速撞向大卡车挂车,路口没有减速,缺乏先验知识;因此,感知替代不了认知,驾驶脑不可或缺,智能驾驶不能丢掉向驾驶员学习的能力。一辆车在路上行驶,车固然要好,驾驶员很重要。但如果无人驾驶,或者自动驾驶,驾驶员作用哪里去了?答案就是我报告的标题:智能驾驶中的自学习。小标题更重要,由此引发一个新的思想“数据定义的软件”。
去年我们用宇通大客车在郑州到开封实现了全世界第一台无人驾驶的公交车,从郑州到开封不受任何交通管制,全无人工干预,在社会各界引起了强烈反响。
谁教谁
首先我们回到智能驾驶的基本问题,谁教谁?汽车这个曾经被称之为改变了世界的机器,正在被软件所改变。我们已习惯这样开发自动驾驶程序:启动计算机程序,让汽车自动开,如果程序不合适,则由人类来调程序,本质上是程序员通过程序教机器人开车,汽车成为软件定义的机器。我今天的副标题是:数据定义的软件,跟这个事情碰撞了。
我们看汽车140年的历史,跨过了三个世纪,19世纪、20世纪、21世纪,一开始是汽车人关注地盘、传动、机械、结构、轮胎、车身,后来人们关注能源、电子电气、发动机、碳排放、被动安全,到现在21世纪人们关注模块化、汽车电子、新能源、线控和数字汽车、电动汽车、主动安全及轻量化。智能化,首先要把模拟量变成数字量,像数码相机从前是胶卷相机、数码相机,以后才是自动相机,以后才是智能相机,所以汽车的智能化路还很长。当前高级辅助驾驶系统正值繁荣期,今年在北京召开的汽车博览会,大家可以看智能系统非常多,自动或无人驾驶已经成为全球一流车企的技术标杆,人工孤立驾驶的时代将一去不复返,把人从低级、烦琐、时驾驶活动中解脱出来,汽车终将转型为轮式机器人。这句话引起大家的共识。
汽车人的渐进式路线认为无人驾驶可望而不可及,涉及到法律、法规、伦理和车联网安全,不看好不设方向盘的无人车,主张双驾双控,在高级辅助驾驶基础上开启自动驾驶。车厂纷纷在自己品牌车型中添加自动驾驶要素,千方百计提高传感器性价比,重点放在传感器的感知处理芯片上实现软件固化,感知信息直接进入CAN总线,降低成本,保持品牌优势,拉长汽车产业发展繁荣期。
高级辅助驾驶系统很多很多,自动驾驶系统也很多,比如语音导航,大家用的高德导航或者百度导航,对道路不熟悉的人用的更多,真正对道路熟悉的人他一般是不用的。自动驾驶也是一样,真正会开车的,用自动驾驶发现它不好使,或者是太慢,或者是你上路条件不符合它就让你转入人工驾驶。所以对于自动驾驶,当你一开始不会用、不会开车的时候你觉得挺有用,但会开车的时候你又觉得它不够用,这就是问题,我把它叫做自动驾驶陷阱。今天我第一次提出这个词,自动驾驶也有陷阱。
驾驶活动充满不确定性,启用自动驾驶的窗口条件不能保证启用后仍然满足,窗口条件太脆弱,容易被打碎,随时要求驾驶员接管。自动驾驶表面上释放了人的手脚,但没有释放人的注意力,本质上是辅助不是自动,仍然是驾驶员担责。车辆行使过程中充满不确定性,汽车如果是软件定义的机器,任何满足当前条件的自动驾驶窗口,无法知晓这种条件能维持多久,要随时准备切换到人工驾驶,因此自动驾驶难,这是个陷阱。
我从科学理解自动驾驶和自主驾驶关系,比如M是自动驾驶模式,当M成W的时候自动驾驶能不能自主驾驶?这是一个学术问题,或者是状态空间的转换问题,它涉及到两个条件,第一个它的充分条件。到底有多少种自动驾驶模式才能完全覆盖各种各样的驾驶场景?必须是充分的才行。第二个,从一种自动驾驶模式转换到另外一种自动驾驶模式,是唯一确定的吗?如果充分条件不具备,这个公式就有疑问。
实时在线的交互认知
自动驾驶的基本问题是驾驶员的作用哪里去了?驾驶员在驾驶过程中遇到环境和周边车辆不断的交互,这叫交互认知,驾驶员的作用在自动驾驶中由谁来顶替?驾驶活动是人在回路的预测和控制,更多的是现场认知和决策。为什么我们坐车的时候我们打瞌睡,驾驶员不打瞌睡,因为他必须时时刻刻看一个当前的驾驶态势,路线怎么走,躲避谁,所以他始终是有事儿干,靠的是技巧、记忆和经验,而不是知识、推理和计算。经验驾驶员长期与车互动,熟练到已经把车同化为人体的一部分,成为与身体无缝对接的真实外延。
驾驶员对道路环境和周边流量交互认知的差异反映个人治理和运动协调能力的差异,有的人倒车倒得了,有的人倒不了,什么原因?小脑不一样,这跟人小脑协调能力强差有关系,所以世界上没有两个相同的脑,也就没有两个完全相同的驾驶员。所以将来市场上跑的车应该是没有两个完全相同的智能车才对。
我们看最近“AlphaGo”围棋战争人类李世石。我们在想,能否让“AlphaGo”和李世石来一次复盘?如果让“AlphaGo”和李世石来复盘,李世石该怎么下还怎么下,“AlphaGo”还那么下吗?大家想想。在比赛之前和比赛之后“AlphaGo”程序变了没有?如果没有变,它肯定没有学到东西,如果变了,就是说程序不一样,这个“AlphaGo”学习到了东西。我们知道“AlphaGo”跟李世石下是第13个版本,现在已经升级到第15个版本,“AlphaGo”程序变得很快。如果让相同版本和不同版本的“AlphaGo”对弈,让两个机器人对弈,结局会如何?能不能提高“AlphaGo”水平?如果“AlphaGo”以后一直和棋篓子下棋,棋商会不会退化?
程序定义的机器受到质疑,机器人应该有学习能力,机器人应该有完整的感知、认知和行为能力,这样的人机大战将会更加激动人心。 “AlphaGo”使用的双网络非常重要,一个是VALUE NETWORKS,承担围棋态势评估,一个是POLICY NETWORKS选择如何落子。向人类棋手学习,从海量样本的胜局和败局中学习,并自动学习提取规则,进行推理。非常兴奋的是,我们智能驾驶的双总线跟“AlphaGo”一样,我们一个叫驾驶态势总线,一个叫做学习总线。
回顾近十年来我们参加的比赛和里程碑试验,智能车各种感知和认知手段,相互依存,彼此缠绕,智能车表现千奇百怪,反反复复,我们困惑过,迷茫过,试来试去,换车、换过平台,加过电源,换模块,尤其是对调参数有更深的体会,通过多车交叉验证和常态试验,最后我们悟出一条真理:难为程序员了,智能车不是程序定义的机器,真正能够教机器人开车的应该是经验驾驶员。
轮式机器人在驾驶员开车时应该能悄悄地自学习,让驾驶员调教机器人开车!让大数据开车。自动驾驶和自主驾驶的根本区别在于机器人有没有象人类一样的在线学习问题。我们说人工驾驶是人在回路中的交互认知。我有一本书叫《不确定人工智能》,其中的一句话摘出来修改下与大家共享:车辆在急匆匆赶往机场的路上。什么叫急匆匆,前方有强光刺眼,离前车的距离突然变小,驾驶员猛刹,反映了不确定性。驾驶员天天开车,没有哪两天的天气是完全相同,道路条件、弯曲度、道路宽窄度也在变化,交通信号灯也是实时变化的。因此没有哪两个驾驶员具有完全相同的驾驶技能,驾驶的不确定性和驾驶员随时间滚动的在线预测控制正是人工自主驾驶的魅力所在。
学什么
智能车研发的困难,不仅仅是汽车动力学的性质和各种各样的传感器要求,更重要的是要研发和驾驶员一样在线的机器驾驶脑,模拟实现人在回路上的自主预测和控制,并对车辆进行控制,应对不确定性。把人在回路中的自主驾驶让车厂去模拟,是难以承受之重,把机器驾驶脑研发让车厂去做是难以承受之重。
这个驾驶脑是什么?轮式机器人学习人在回路中的预测控制,应对驾驶活动随时间滚动的不确定性确保安全性。
预测控制,大家看到自动化书籍,其中有预测控制系列书有十多本都讲MPC,驾驶员在有限时域的预测和随时间滚动优化,始终用当前的预测值刷新优化,并重新求得下一个有限时域内的解,仅仅将解控制序列过程中基本元素形成一些反馈控制域作为预测,这个动作如果不去模拟,智能车做不好,无人车做不好。
人在开车过程当中他的视野,他的注视高度,预瞄点和车速相关,一个驾驶员,每小时36公里的时候,视力1.1,你看不见,因为车子运动了,你视力下降了,所以要把这个看清楚,把驾驶员时刻预瞄点找到就可以,我们回归一下,车速V与注视点焦距F的关系是拟合函数关系。让机器驾驶脑具有驾驶员现场交互认知的能力,就需要基于自主可控的路权预测控制。轮式机器人要学习人的驾驶交互认知能力,根据驾驶员的脚感、手感、路感、体感,这么多的交互。
怎么学?
这就是我们做的学习总结,我们专门设计了学习认知,叫寻“的”驾驶。轮式机器人涉及时变、非线性、有时滞,是多约束条件下的目标优化。首先是安全性高,第二个舒适性好,踩了油门马上踩刹车肯定是危险。我们认为要学习自动驾驶的记忆认知、交互认知。
驾驶认知的形式化,强调如何用人工智能技术代替驾驶员的感知、认知和行为,确保车辆自主行使,不必纠结于机器人工驾驶交换,也不必纠结于人工驾驶和自动驾驶的交换行使。
我们在三个不同的记忆区,构造不同尺度连接组的、三位一体的多层认知网络,在感觉记忆是感知理解,工作记忆是认知理解,长期记忆可能是驾驶知识图谱。用瞬间记忆池和态势记忆池来判断转换尺度到底刹车还是制动,这就在瞬间记忆、工作记忆和长期记忆中的反馈作用。
我们将调试总线扩展为自学习总线,开创自学习板块,完成深度学习和进化学习,让轮式机器人像人一样学习。人工驾驶时将经验驾驶员对油门、制动和方向盘的操控量抽象为认知箭头,与机器视觉形成的驾驶态势图进行一一对应,悄悄地生成碎片化的驾驶态势、认知箭头图对形成深度学习驾驶学习机器算法。
这里面出来一个科学问题,端到端的深度学习中端的选择和论证,最近英伟达做了一个很有意思的工作,利用一个摄像头来看一个前景,学习方向盘转角,用来控制方向盘转角。这个论文题目叫End to End learning for Self—Driving Cars。
深度学习固然好,但是有局限性。太多的学习参数具有随意性,人家做得好你可能做不好,科学本来是可以重复的,偏偏他的学习环境拿到你这里不行。不能保证深度学习的收敛性,尤其缺少反馈机制,而且大量案例没有先来后到,也不具有累计性。
因为深度学习和规则程序的巨大差别是学习结果不具有可解释性,传统变成仍然起着搭建“脚手架”的作用。这个和我们自学习人工智能差别很大,我们把自动驾驶的认知板块、自学习板块拿过来学习。当今深度学习正站在全球人工智能的风口,普遍把人工神经网络用于点云图象时候也是识别完成感知阶段的自学习,而我们另辟蹊径,把人工神经网络用于形式化之后的基于可用路权的驾驶态势图,认知家箭头形成的图上,用于认知阶段的学习,这样一来大大简化了数据量。
我们驾驶脑的定位对应的是驾照,传感器替代不了驾照,车厂替代不了。第二它对应是驾龄,会开车不代表你开的好,你的经验积累很重要,驾照替代不了。第三对应的是路熟,地图是死地图,你放到坐标系来才是活地图,我要用的是对于我的活的地图。驾驶脑的关键是驾驶认知形式化。
深度学习普遍应用可以做路口驾驶记忆棒,事故预防应对记忆棒,驾驶困境应对记忆棒等等。人工智能的伟大在于它可以很快地把几个人的知识集成到、放到一个新的版本里,比人的生物进化要快的多。
云计算、大数据助推并成成就了人工智能,如果把我们双网络架构加上云感知、云导航、云认知、云交互、云学习,将来所有的事故在我们大数据存储情况下,如果技术积累到一辆车上来,那事故率就大大降低了。
最后回到数据定义的软件。在传统软件过程中,我们强调软件定义过程中,我们强调软件等于程序加数据加文档,文档是用数据表达,程序也是用数据表达,程序拿来要有模型,模型拿来要有形式化约束,这就是知识驱动的人工智能,先要有模型,然后再算法,然后用程序,这是软件定义的机器。这时候数据是围着程序转。今天是大数据时代,已经不仅仅是机器驱动人工智能,而是知识和数据双驱动人工智能,在这样的情况之下,数据可以定义程序,就是数据驱动的程序。由上而下的知识驱动早先给出的形式化约束较为宽松,由此形成的脚手架,就是模型和算法应该比较宽泛,在依据算法实现的程序中,会存在很多可选参数和可选的代码。由下而上的数据驱动过程中这样的程序通过大数据的训练和系被精细化调教,多次迭代,使得参数逐步冻结和优化,有一些模型,现在特征说不出来,不是由上而下,而是由下而上形成,一来就形成了知识、数据、程序双驱动的人工智能。今天机器人通过大样本深度学习终于可以聪明到足以改写程序中的参数,甚至离线程序。所以我们在线调整参数,人工智核心不仅仅是算法,更是学习,大数据环境下充分发挥碎片化和大数据认知的机理,克服宏观认知的形式化困难,细分约束区间,通过大量微观认知的形式化,降低形式化难度,缩小了在线推理范围,生成数据定义的软件,让程序围着数据转,谢谢大家!
相关文章:
“钢铁侠”崩溃!马斯克哭了:“是我傻X,太信机器人了!”去中国很有必要,但……
每天一杯咖啡吸收宇宙能量!
重构思维方式,
AI+时代,读互联网思想(wanging0123)
联系方式:投稿及内容合作|271684300@qq.com