其他
大牛讲堂 | 刘景初:上帝视角与想象力——自动驾驶感知的新范式
导读
3月28日,在「地平线自动驾驶技术专场」上,地平线自动驾驶系统架构师刘景初博士围绕《上帝视角与想象力——自动驾驶感知的新范式 》这一主题进行了直播讲解。先来看一张简单的图,分享下地平线对于自动驾驶的理解。自动驾驶的目标比较简单,通常有三个:安全、舒适、效率。一般安全是第一位的,因为谁也不是希望自动驾驶出事,它是为了不出事而设计的系统。除了安全之外,是舒适和效率,对于不同的车型,这两个目标会有不一样的折衷。如果是日常生活中的乘用车,舒适应该会更重要一些,因为很多人不希望在日常通行过程中频繁体验推背感,所以舒适对于乘用车来说比较重要。最后是效率,大家都不希望为了舒适,车辆只以5迈的速度在街上行驶。更多是希望在满足安全、舒适的前提下,尽快把我们送到想去的目的地。
在一些其他场景之下,舒适和效率可能会有顺序的交换。比如一些运货的车,车上没有易碎物品,舒适性上可以稍微打折扣,在不损坏货物的前提下,急刹车或者加速是允许的,这时可以把效率的优先级提高一些。
从我个人的理解来看,自动驾驶最终要服务的系统级目标是安全、舒适、效率。为了实现这个目标,自动驾驶已经研发了数十年,典型的系统pipeline没有太多变化。在典型的pipeline中,最上游是传感器,类比于人的感官,像眼睛、耳朵、触觉等传感器;再往下游是大脑中对原始传感器信息的处理,并从中提取一些有意义的、抽象的、精简的信息,这部分一般叫做环境感知。
再往后是定位地图。如果不是熟路,车主在开车的过程中是很容易迷路的,在很多主流的自动驾驶方案中,地图或高精地图是比较重要的一环,它的基本作用是作为离线感知器,把人眼看不到、耳朵听不到的超视距信息,预先通过一些预处理方法形成一个数据结构。当人在线开车时,通过定位把信息recall回来,放到当前的局部坐标系下,这样就能看得更远、更全,获得更好的感知效果。环境感知和定位地图都是为了完成感知,只是一个是在线的,一个是离线的,这两个模块的边界在不同公司也会有不同的划分。
再往下游是决策规划。决策规划笼统划分可以分为决策模块和规划模块,若是更细分,可分为决策、预测、规划和控制这四个模块。最核心的问题是如何处理场景中与其他交通参与者的动态博弈。之所以在图1中规划决策模块上放了“下棋”的图标,因为决策和规划这两个最主要技术模块的内部过程,与下棋有很多异曲同工之处,很多用来解决下棋问题的方法,某种程度上也可以应用在决策规划模块中。
最后是控制执行。这部分是怎么样把计算出的车辆油门、刹车、转向等信息传递到车身中,然后让车去执行。
中间三个环节比较偏算法,所以用颜色比较深的形式表达;而两端偏硬件外设,是由车的硬件架构决定,所以用颜色比较浅的形式表示。虽然pipeline在这几十年来已逐渐成型,但是通过什么样的软件和硬件划分方式来实现这些模块,在最近几年有很大的演进趋势变化。
看下图1中最下面的方框,上面箭头表达的是以往主流的划分方式,竖杠与上面的 pipeline对应,比如传感器,一般意义上来看,传感器是纯硬件外设,甚至一部分感知工作或一些很前端的信号处理,都是硬件外设来完成的。硬件外设的特点是运算速度很快,功耗比很出色,但它的灵活性相对比较差
01 自动驾驶结构演化提出算法新需求
02 软件2.0下新的感知范式
下面分几个环节讨论下地平线在这方面的思考和实践。
03 BEV感知的十八般武艺
04 云端一体的BEV感知开发
以做 BEV的静态感知标注为例,如15图右上角所示,这里面展示的是一辆车,在一个路口右转了一次,方框是感知范围,另外一辆车在路口直行了一次,又一辆车反方向直行一次,经过这样信息聚合,就可以得到一个完整的场景。它很像地图,但与地图也有一些不太一样的地方,一般地图强调的是世界最新的样子,而且是在全局和世界的关系下的位置样子。