查看原文
其他

当自动驾驶功能逐渐趋同,“弱高精地图”体验将成为下一战的桥头堡

圆周智行 圆周智行 2023-01-05

近日,智行者发布了自研的高速领航系统H-INP(Highway – Idriver+ Navigation Pilot),官方将其称为国内首个采用“重感知 轻地图”技术路线的高级别自动驾驶解决方案。


现阶段,高精地图在使用层面仍然存在不少问题,比如无法做到全方位覆盖,“鲜度”不够,成本高等,这很影响用户对智能辅助驾驶的使用体验。


比如在高速路段行驶的时候,车辆可能会莫名减速。原因是高精地图的标记错误,因为高精地图的更新频率是以季度为单位的,更新不及时就容易出现一些“突发状况”。


再比如,上下匝道时,驾驶员需要被迫接管的情况,因为图商在做高精地图信息采集的时候,是主路先跑一遍,然后各个匝道分别跑一遍,之后做数据拼接,拼接的时候数据容易出错,就容易造成系统错误的情况。


又或者,道路施工以及非高速/城市快速路的道路,高精地图还没有及时更新或覆盖,都会导致辅助驾驶功能无法正常工作。


这些碎片化的长尾场景是目前高精地图存在的普遍问题,不仅影响用户体验,甚至可能存在一定的安全隐患。


鉴于此,不依赖高精地图成了车企们在开发高阶辅助驾驶功能时的迫切诉求。小鹏汽车创始人何小鹏,华为智能汽车事业部BU CEO余承东都曾在公开场合表示,高阶辅助驾驶不应该过分依赖高精地图。


甚至有不少企业已经开始了“重感知,轻地图”的辅助驾驶技术路线的探索,如毫末智行、上海智驾等,但智行者率先喊出了“国内首个不依赖高精地图的高阶自动驾驶解决方案”的口号。


智行者介绍,H-INP可以在高速公路、城市快速道路、连接匝道、停车场等多种场景下实现智能领航辅助功能。包括自主巡航、出入匝道、自主换道、隧道通行、智能偏航、超控模式、自动泊车、碰撞预警等功能。


那么,智行者是如何实现弱高精地图的?背后的难点在哪里?


《圆周智行》与智行者技术开发团队进行了深度交流,试图还原背后的技术原理。



何为不依赖高精地图


首先需要明确的一个基本概念:不依赖高精地图的核心逻辑是,在没有高精地图存在的地方需要系统构建实时高精地图来供车辆完成自动驾驶动作。


其中的关键在于实时建图,过程中需要解决几个重点问题,包括:


1、不同传感器信息在空间上的融合。


由于每一个传感器都有FOV视场角的限制,且安装位置不同,导致任何一个传感器都只能看到当前环境的局部信息,因此所有感知系统都存在空间碎片化问题。比如左边的摄像头只能看到左边,右边的摄像头只能看到右边,前向摄像头只能看到车前信息,都是局部信息。所以要确定当前环境的全部信息,就需要对车上所有传感器搜集到的信息进行空间融合。


空间融合的目的是为了确定路面的语义信息。


2、然后将路面语义信息在时间上累积对齐、分析车道拓扑关系,完成环境建模。


“路面语义信息在时间上累积对齐”指,把不同时刻看到的路面标线拼接起来,形成一张更大点更稳定的图。


“车道拓扑关系”指,路面信息之间的相互关系。比如哪些标线组成了一个车道,车道和车道的关系是什么、哪些车道组成了一条道路等。


通过这些信息,完成对当前环境的建模。


3、最后将车载导航信息与环境建模结果关联起来,赋予各个车道以导航属性,明确哪个车道能够到达目的地,从而得到一个实时构建的局部高精度地图。


以上就是一个完整的实时高精地图构建过程。其中核心的技术问题包括,不同传感器的空间融合,语义信息矢量环境重建,以及车道级导航分析。中间还牵扯到规控层面的数据训练等问题,下文会重点讲到。


下面,我们来逐个拆解:


不同传感器的空间融合


针对不同传感器数据的空间融合问题,智行者提出了“时空联合的多任务融合感知”方案。


“多任务”指目标检测、语义分割、标线检测等多种感知任务。


“融合”主要是指视觉、毫米波和激光雷达等传感器特征或者目标的融合。


通过深度神经网络从图像(相机数据)和点云数据(激光雷达数据)中提取单传感器或单视角数据的深度特征,然后采用基于Transformer(注意力机制,深度学习算法的一种)的多传感器特征和多视角特征融合机制,得到当前时刻的BEV(鸟瞰图)特征。



针对感知系统的空间碎片化问题,即融合时序信息,智行者设计了一个时序特征融合模块,将历史时刻的BEV特征和当前时刻的BEV特征融合得到最终时空特征。


基于该融合特征,系统可实现人车目标检测、红绿灯检测、路面标线检测、可行驶区域分割和标志牌检测识别等多个感知任务。


整个思路其实和毫末智行在空间上的融合差不多。


语义信息在线高精度矢量环境重建


知道了周围环境信息,需要根据语义信息对当前环境进行“在线高精度矢量重建”,简单讲就是把多帧感知看到的车道线、箭头、马路牙子等信息用矢量表达的方式在时空上拼接起来,形成一张用这些矢量信息表达的局部地图,将离散的感知信息结构化。


先来看看业内在这方面是如何处理的。


目前,业内普遍采用重地图的环境建模方案,即以HDMap(高精地图)提供的车道线和车道拓扑关系为唯一静态环境建模依据,感知车道线只是辅助高精度定位的手段,环境建模结果的准确性与定位精度强相关,如果高精地图出错,环境建模也会跟着出错,导致自动驾驶的行为出错。本质上又回到了依赖高精地图的逻辑。


智行者摆脱对高精地图的依赖,提出了一套重感知的环境建模方案。它以SD地图(普通地图)和感知为支撑。其中,地图主要提供先验的道路拓扑结构信息,而感知确定车道线位置、道路边界等信息,并且确立动态障碍物和车道线的关系,让定位更加准确。



在线高精矢量重建地图定位架构


环境建模完成之后,需要对车辆进行定位。官方采用的是“在线高精矢量重建地图定位架构”,具体的技术细节和流程如下:


首先利用视觉或激光雷达得到DR坐标和车道线等语义信息的深度估计,对其进行局部矢量地图平滑优化,得到一定范围内相对光滑、稳定的矢量地图结构。


然后使用DR坐标、卫星定位和局部矢量地图进行SD或者HD地图匹配定位,最后通过位姿图优化得到最终的绝对定位。



此外,基于局部矢量地图进行匹配也使得匹配定位结果鲁棒性更强,不易受单帧感知结果抖动影响,最后的位置图优化还可以抵抗异常卫星定位结果,保障整体绝对定位的稳定性。


强交互时空联合决策规划


确定了车辆的具体位置,接下来就是规控设计。


自车在做自动驾驶策略规划时,需要实时预测其他交通参与者的信息,先预测再决策,比如看到侧向车辆突然向自己靠近预测其是否会加塞等。


在决策规划方面,业内目前普遍应用“弱交互时空解耦决策规划”方案。简单点说,就是自车只管自己,不与他车互动,或者只考虑某一时刻与他车的互动;并且以固定逻辑预测他车轨迹以确定的状态作为硬约束引入决策规划,导致决策规划结果生硬、舒适性差。举个例子,当看到他车向自己靠近时,默认对方是要向自己这边变道,也许对方只是偏了一下方向而已。做一些不必要的躲闪或者减速动作。


智行者提出了一套强交互的时空联合决策规划方案。在预测与决策环节,根据他车轨迹模态和时空分布进行概率建模,同时充分考虑自车未来各种可能行为对他车的潜在影响,将决策问题变为他车与自车行为的联合优化问题,从而表现出与环境车辆的主动交互,同时保障车辆舒适性;


决策规控需要大量的数据训练,业内的普通做法都绕不开仿真训练。但仿真缺乏交互性建模,仿真环境中的车辆行为也与真车相去甚远,优化出的决策策略也总与现实存在差距,实车还需要不停调试;


智行者的做法是将基于实车数据训练的轨迹预测模型嵌入仿真环境,以此强化训练策略;将真实数据放入实际仿真模型中训练也是业内的常见思路,但是智行者创新性地将该思路应用在了交互预测与决策领域。


决策规划过程中还会碰到一个问题,即纵横向解耦的决策规划方案导致一些高级的驾驶行为无法实现;在线决策规划环节,智行者的做法是,基于SLT坐标系进行纵横向耦合的决策规划问题求解,提升车辆的通行能力。



基于以上流程,一套完整的“弱地图 重感知”方案的高级辅助驾驶动作完成。


据智行者介绍,除了不依赖高精地图,H-INP系统的另一个优势是,采用了软硬件一体的自动驾驶解决方案。即搭载了自研的域控制器及算法。


其中,域控制器的整机功能工作电压是9~ 16伏,静态电流小于1毫安,尺寸200×175×45,采取单向出线方案;算力是128Tops,然后内存和硬盘分别是8GB和64G,如果有特殊的数据存储需求,也可以扩展。


接口除了13V5R12U感知接入,DVR、eMirrior、AVM视觉输出;还可以通过1路10Gbe车载以太网和3路千兆车载以太网,支持4D雷达、OBU、V2X以及CGW(网关)等支持各种OTA升级、智能网联的功能。


此外,H-INP还采用了平台化设计,可在此统一架构下开发出系列产品,满足不同场景的需求。智行者透露,未来还将以该设计方案为基础打造适用于城市场景的城市领航系统C-INP系统。



随着高阶辅助驾驶功能逐渐趋同,企业的关注重点将逐渐向使用体验上转移。高精地图的问题由于短期内难以根除,要提升用户体验,不依赖高精地图会成为企业在下一个争夺战中的桥头堡。


推荐阅读:

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存