查看原文
其他

Mobileye炫技,仅凭12摄像头穿越闹市区,一辆优秀的L4无人车该是怎样的?| 郭继舜带你读汽车科技

郭继舜 汽车之心 2021-08-26


编者按:《郭继舜带你读汽车科技》旨在从第一性原理出发,尝试拨开迷雾,解读热点背后的汽车科技真相。


本栏目由智能驾驶专家郭继舜博士与汽车之心联合出品,内容独家授权汽车之心发布。

今天我们来聊聊上个月月底 Mobileye 放出的一段 40 分钟的自动驾驶路测视频。


我把视频的链接放在了文稿中,视频基本是两倍速播放,但依然有 20 多分钟。Mobileye 官方非常骄傲地宣称,这是一段一刀未减、一镜到底的视频。


在这段视频中,我们可以看到非常复杂的城市自动驾驶场景:无保护左转、被迫超车、十字路口礼让行人、识别路边停泊的车辆并提前变道等在城市道路经常出现的各种工况,Mobileye 的 L4 自动驾驶车都很顺利地通过了。



我记得多年前在百度 IDL 的时候,有一年新年开年会,余凯老师新年致辞,讲到刚刚去以色列进行技术交流,一个常年战乱国家的科技实力和创新能力让他震撼。


我很少看到他一脸虔诚,所以「硅谷的后花园」这个名字印在了心里。


多年之后,凯哥的地平线机器人也全力投入研发车载人工智能芯片,征程系列和 Mobileye 的 EyeQ 系列正面硬刚。这样连起来看,是一个热血励志的好故事。


去年年初,因为车型开发的原因,我在耶路撒冷驻扎了一段时间,每天就在 Mobileye 公司和他们一起工作。


在这片应许之地,我每天都想念中国的美食和湿润的气候。


同时,我发现,Mobileye 在以色列真是个国宝级的企业,以色列政府在尽所有能力帮助 Mobileye 成为世界级的领先科技公司。


我在打出租车的时候发现,每辆出租车都有 Mobileye 后装的行车记录仪,司机告诉我说,这是政府要求所有的商务运营车辆一定要安装。


这在保证安全取证的情况下,也顺便帮助 Mobileye 收集了更多场景数据。


也许是很多亚洲企业都有和 Mobileye 合作的经历,有一次我打到一辆出租车,上车后没等我说话,司机就问我:「是去 Mobileye 吧?」足见 Mobileye 在以色列的名气。


另外,说来惭愧,连这个公司的发音都是一位出租车司机纠正我的——It's not Mobile-eye, the pronunciation is Mobileye。


Mobileye 的两栋小楼在耶路撒冷的一个科技园区,在那段时间里,我们一起对他们的 EyeQ3、EyeQ4、EyeQ5 的技术特点和量产应用功能做了非常深入的探讨和测试。


很明显地感受是,以深度学习为代表的人工智能算法,赋予 EyeQ 系列芯片强大的算法性能和这一系列芯片持续的生命力。


用单目摄像头快速得到前方车辆 3D Bounding Box 和前方道路凹凸信息的准确度和实时性让人吃惊。


全球车载人工智能芯片 70% 的市场占有率不是运气偶然。


另外,一些国际知名的Tier1,请努力说服你们的技术团队吧,快加入深度学习,别只使用传统视觉算法了,技术局限性太大。


当时在一个工作日的下午,我试乘了 Mobileye 的 L4 demo 车,一辆红色的特斯拉 Model S,周身 12 个摄像头,没有激光雷达,也没有毫米波雷达。


印象里,当时这辆车用的还是上位机的硬件解决方案,在后备箱有 3 个 TitanX,据说现在已经换成两片 Mobileye 自家的 EyeQ5 (算法的嵌入式化和算法剪枝应该花了不少精力)。


如果我没看错,此次公布的视频里,车也换成了 2017 款的福特蒙迪欧。


在这次试乘之前,我是不太相信同构的传感器解决方案能完成高级别智能驾驶功能的,别说 L4 城市路况,连高速公路上 L3 的复杂功能,我也坚定地认为需要多种传感器协同完成。


但当我坐在这辆 12 个摄像头就是全部传感器硬件的红色特斯拉在耶路撒冷街头飞驰的时候,我动摇了,一霎间觉得,在技术飞速创新的今天,真的没有什么不可能。


我把这次试乘的感受试着向大家总结一下:


1. 路感异常平顺,加速减速都很稳健,红绿灯路口没有出现急刹,启停颇有点老司机的意思;


2. 在展现识别算法高层语义信息的显示屏上,我看到,所有的车辆和行人,不光做了识别分类,给出了 3D 的 Bounding Box,还预测了每辆汽车和行人的路径;


3. 我们路试的时间是下午 4、5 点,阳光的斜射已经非常明显了,可能是多个角度的摄像头的原因,感觉阳光斜射对自动驾驶的影响不大;


4. 全程大概 30 分钟的时间,绕着耶路撒冷城区转了一圈,遇到非常多异常工况,但没有一次接管,而且在一个进入下穿隧道的场景,车辆还猛然加速,感觉很像是一个对道路非常熟悉的老朋友开车载你去机场赶飞机。安全员告诉我,这一段是故意设定的,就是为了显示一下 Mobileye 的技术能力。


坐在快速行驶的自动驾驶汽车上,看着路边拿着圣经,带着黑色礼帽赶去哭墙朝圣的行人,前沿的科技和古老的圣城,在夕阳下的金色庙宇,那种感觉真的很奇妙。


接下来,我们来聊聊优秀的 L4 自动驾驶汽车应该具备的技术能力,以下观点仅代表个人,没有任何利益相关。


在智能驾驶的研发路径中,我们将会面临两个大考:


第一个就是从 L2 到 L3 的考验。


驾驶的法律责任从司机转移到了自动驾驶的车辆,这就对系统的运算能力、算法鲁棒性、系统冗余能力、系统对抗不确定的场景、人机交互等提出了一系列挑战的要求。


现阶段,就是因为安全的脱手、脱眼、脱脚的系统太难做了,同时,人车共驾的交互逻辑很难厘清,市场上进化出了 L2.5、L2.9 等中间状态的量产车型;


第二个考验就是从现在的各种 Demo 演示级别的「L4」到真正商业化可用的 L4 自动驾驶,有几个关键特征:


  • 能否去掉「安全员」,让自动驾驶完全的掌控车辆的控制权;

  • 能否在云端对车辆进行实时调度和路径规划,实现云端对自动驾驶集群的管理

  • 能否实现全工况的免维护,自动充电、自动停泊、自动载客和结算

  • 能否在车辆出现故障的时候及时远程处理和接管车辆


当然,现阶段限制各个科技公司的,可能并不是以上的技术问题,而是法规政策的允许和支持。


从技术角度,我们大概从车辆平台计算平台感知决策功能安全适用场景等几个方面说。


1.车辆平台和计算平台


一个好的 L4 自动驾驶系统,必须配备一个优秀的车辆平台,才能真正发挥算法的先进性,让算法的运算结果能够准确、快速、稳定地获得响应与执行,比如很多科技公司在使用的林肯 MKZ,就是一款把线控优化得非常出色的智能驾驶平台车。


总得来说,一个好的智能驾驶平台车要有不超过 400ms 的制动响应,高精度的转向能力,双冗余的执行系统,不少于 1500W 的充沛的低电压大电流供电。


关于自动驾驶平台车的技术,我们明天单独来讲。


现阶段很多科技公司还在使用工控机加 GPU 的方式作为 L4 自动驾驶的运算平台,但为了后续的大规模应用和容易维护,使用 MDC、Xavier 等高性能、低功耗、高可用的嵌入式运算平台,将逐渐成为技术的主流。


只有尽量地减少硬件的维护成本,自动驾驶的商业预期才会越明朗。


2.感知


现阶段的 L4 自动驾驶车辆传感器套装大多是高线数旋转机械激光雷达,辅助以视觉感知,以及毫米波雷达的感知结果融合,但是这样的传感套件,由于机械雷达的结构,通过车规认证是比较困难的,暂时还无法实现前装量产。


除了价格昂贵以外,高线数机械旋转式激光因为实现原理的问题,造成设备易损耗、需要定期校准,使用维护成本高等等缺陷。


而摄像头视觉方案虽然能够通过车规,但是对视觉算法的要求更高,开发难度很大,失效可能性较高。


如果想要大规模商用自动驾驶汽车,并且组建容易维护保养简单的自动驾驶车队,几十台上百台汽车,我们用改装的方案还勉强可行。


如果几千台自动驾驶还是用改装方案,无论是改装的工作量巨大,还是每台车的手动改装一致性差导致系统问题,都是自动驾驶大规模应用的挑战。


这也是为什么 Waymo 要从克莱斯勒和捷豹路虎订制十万台前装 L4 自动驾驶车的原因。


所以,一个考虑可前装量产的好的 L4 自动驾驶技术的感知方案,最好是考虑使用车规级的多传感器融合的感知套件(固态或者混合固态激光雷达+视觉+毫米波等)


在多传感器融合的传感感知套件的支持下,L4 自动驾驶需要具备更加智能的感知认知能力。


现在的感知算法实际上更多的是实现「目标识别」的感知智能,也即是只能够获得感知场景中的物体的类别、方位、速度、大小等等浅层认知属性。


而对于目标所关联的更加抽象的语义信息,多个目标互相作用可能造成的场景事件信息,都只能够做到有限的认知。比如红绿灯、交通标志、学校标记等等。


但是更加深层抽象的事件意义的认知,就无能为力了,比如交警的手势,小学生过马路等等。这些需要更加多的社会常识与交通规则数据库的支持,才能够实现真正的」认知智能」。


我最近也看到不少 L4 自动驾驶公司在这个层面有了很好的成果突破。


3.决策


现在经常听到自动驾驶公司谈到的一个词就是「Corner Case」,也就是在他们现有的自动驾驶算法中无法覆盖的场景。


这些场景,可能是一些系统设计时的失效边界,可能是某些交通参与者意料之外的行为,也可能是算法自身的某些 Bug,可能总量并不大,发生概率也很小,但是即使是万分之一的可能性,也需要算法开发人员花费 80% 的精力去解决,而且越来越难。


所以一个好的 L4 自动驾驶技术方案,需要的是更加优秀的算法框架,一般能够在遇到无法解决的 Corner Case 的时候至少有一个兜底的预案,保证不会出现更加糟糕的情况。


其次需要的是一个快速应对 Corner Case 的处理开发流程闭环,以便能够在发现 Corner Case 时快速迭代,给出 0Day(即当天发现当天解决)升级方案。


然后还要全面完善的测试数据采集应用流程体系,以便能够获得更加多样的场景测试数据以及更加强大的数据应用能力。


一方面通过数据挖掘能力获得更多的算法优化性能,另一方面,也可以通过虚拟仿真等等数据扩增技术来让数据的利用率更高,举一反三,实现更好的自动驾驶经验的累积与算法的进化。


4.功能安全


作为事关生命安全的系统,自动驾驶系统尤其需要解决安全的问题。但是以 ISO26262 为代表的传统「汽车功能安全分析」方法,已经不能够应付 L3 级别以上的自动驾驶系统的开发需要了。


因为 L3 以上自动驾驶系统不能够像 L1、L2 辅助驾驶系统一样简单划分成为一个个独立的驾驶功能,例如 AEB,ACC、LKA,而是一个综合协同的复杂系统。


再加上不仅仅是机械和电子失效,功能设计的逻辑失效问题成为高级别智能驾驶的新痛点。随着 SOTIF ISO21448 预期功能安全讨论稿的提出,行业似乎找到了新的可参考的方向。


但是,在 L4 以上自动驾驶系统的安全设计中,由于现阶段,暂时没有办法明确的定义功能,即便是预期功能安全分析也可能会力不从心。


后续的解决方法,可能只有充分利用人工智能的辅助,通过虚拟仿真测试以及基于对抗网络的场景生成技术,以一种系统攻防的方式进行自动化的自动驾驶安全设计与验证,才可能实现真正的」预期安全「的目标。


5.应用场景


现在的 L4 自动驾驶技术到目前为止,由于法律法规的限制,都是在一个限定的区域进行示范性的运营与测试的。


其面临的场景与积累的数据类型都是有限的,并不能够覆盖实际生活中方方面面的真实场景与实际应用。


不久的将来,随着法律法规的放开,当 L4 自动驾驶技术真正走出限定区域的束缚,走向生活中真正的应用场景,走向真正的大规模商业化落地应用,在真实的商业搏杀大浪淘沙,最优秀的 L4 自动驾驶技术会快速脱颖而出。


在这个过程中,优秀的 L4 自动驾驶企业将凭借更低的全生命周期研发成本、运营成本、更好的系统性能、可靠性、更强的盈利能力、更好的用户体验等种种优势,成为笑到最后的胜利者。


预告:明天,我们讲讲 L4 自动驾驶平台车的相关技术。


往期回顾:



本期制作


主讲:郭继舜  监制:王德芙

 编辑:叶方     后期:陆非    

设计:陈溪阳  运营:林芝芝


音频平台


喜马拉雅 | 蜻蜓 FM | 听伴

Podcasts | 小鹅通

在以上平台搜索关注汽车之心

即可收听全部节目


「汽车之心·行家说」预告


6 月 10 日周三晚上 20:00-21:00,小鹏汽车互联网中心副总经理刘毅林将带来主题为《当汽车遇上智能》的分享。

欢迎扫描下方二维码预约收看直播。



 ▼ 点击阅读原文,观看「汽车之心·行家说」往期回放。

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存