其他
理想照进现实,自动驾驶必须迈过的坎
The following article is from 技术大院 Author 技术大院
【导读】根据世界卫生组织的数据,汽车事故是全球第二大死亡原因,每年约有 130 万人死于交通意外。其中中国的死亡人数约 260,000 人,美国约 40,000 人。发展中国家的汽车保有量还在增长,进而导致全球交通事故死亡人数继续上升。美国国家公路和运输安全局发现,在美国有超过 92% 的交通事故案例是人为错误引发的。一些分析表明,用自动驾驶汽车取代人类驾驶员,每年可以减少多达 100 万的全球死亡人数。
自动驾驶汽车本质上是与人类驾驶车辆具有相同要求的机器人—— 它们应该具备驾驶和停车技能、与其他汽车和基础设施通信的能力、导航技能以及获取能源的能力。行业利用人工智能技术来训练自动驾驶车辆行驶和停车、读取路标以及检测高速公路上的物体,然后处理检测结果以做出决策。
那么在未来,人类会在陆地、海洋和空中采用自动驾驶交通工具(AV)来解决一系列社会问题吗?要想实现这样的目的,自动驾驶还需要迈过哪些坎?
汽车感知与决策
2D图像语义分割、3D目标检测、3D语义分割的精度下降 训练样本数量偏少 高的标注成本 不平衡的训练数据 不完整的场景覆盖 模型不可解释、需要大量的数据、训练过程不可控、鲁棒性不够 多传感器融合的耦合性较高,真正异构的多传感器融合比较少 没有全天候,全场景的覆盖研究 雨天、雪天、雾天 山路、乡村路、冰雪路 对高动态的场景缺少在线验证的方法,无法评估正确性与稳定性
规划与决策存在问题:
环境感知系统不太准确,导致预测模块(意图与轨迹)结果不准确,导致自车与目标博弈算法失败,使得决策系统更倾向于保守的规则(停车)
比如评估当前场景变化莫测,系统很难避障,系统就会选择停车
如果与后车间距又太小,就会一直等着,直到前方可通行
根据划分力度的不同,会造成场景的数量不断的增加
几百万到几千万量级都是有可能的,无法去评估
超低速情况也是planning的一个主要挑战
车辆设计都会有一个待速的要求,如果低于这个速度了可能会熄火,尤其是内燃机这种车
在待速情况下很难走出预先设定的轨迹,不够细腻,造成避障与会车的失败
人由于在驾驶可以含着刹车,并且开车处于不断试探的过程,可以不断博弈,而自动驾驶就无法很好的cover
决策的伦理性和责任认定还不成熟
一种选择是让 AV 学习如何通过模拟训练来做决策 截至 2020 年,Waymo(前身为谷歌自动驾驶汽车项目,它是 Alphabet 的子公司)已经模拟了 150 亿英里的行驶里程,其中真实里程仅为 2000 万英里 通过模拟训练,自动驾驶汽车可以获得更多经验并更好地了解它们可能遇到的各种可能场景 不幸的是,由于训练人工智能的数据与现实世界中的数据之间存在差异,机器学习过程无法判断模拟训练中使用的哪些模型在真实世界中是行之有效的 另一种选择是在联邦政府指定的自动驾驶汽车试验场上测试汽车 这些试验场有定制的高速公路、停车场、十字路口和通信网络,车辆通过这些网络相互“对话”并与基础设施“对话” AI 软件、底层处理硬件和传感器负责 AV 的决策
数据处理和通信
技术层面:存算一体芯片涉及器件-芯片-算法-应用等多层次的跨层协同 细分应用场景的不同性能需求决定了神经网络算法与芯片的设计,算法依赖神经网络框架、编译、驱动、映射等工具与芯片架构的协同,芯片架构又依赖器件、电路与代工厂工艺 器件物理原理、行为特性、集成工艺都不尽相同,需要跨层协同来实现性能(精度、功耗、时延等)与成本的最优 产业生态层面:作为一种新兴技术,想要得到大规模普及,离不开产业生态的建设,需要得到芯片厂商、软件工具厂商、应用集成厂商等的大力协同、研发、推广与应用,实现性能与场景结合与落地
电池和充电系统
高通已经证明,即使车辆以 70 英里 / 小时的速度行驶并且表面被水覆盖,也可以在行驶中充电 使用这种方法时电池就用不着充电了,因为在路上行驶时不会消耗电池电量 这将消除人们对 EV 续航里程的担忧,并可能让电力成为汽车的标准能源 然而,人类长期暴露于弱磁场中时身体健康受到的影响目前尚不清楚。因此需要在这方面进行更多的研究以确保人身安全
陷入误区:算力堆不出自动驾驶
我们说“数据是生产资料”,而提供处理数据的芯片是工具,不可能工具反客为主成为核心。工具是必备的,但是更重要的核心是跑在上面的软件。
谷歌第一代TPU,理论值为90TOPS算力,最差真实值只有1/9,也就是10TOPS算力,因为第一代内存带宽仅34GB/s 第二代TPU下血本使用了HBM内存,带宽提升到600GB/s(单一芯片,TPU V2板内存总带宽2400GB/s) 最新的英伟达的A100使用40GB的2代HBM,带宽提升到1600GB/s,比V100提升大约73% 特斯拉是128 bitLPDDR4-4266,内存的带宽:2133MHz*2DDR*128bit/8/1000=68.256GB/s。比第一代TPU略好(这些都是理论上的最大峰值带宽)其性能最差真实值估计是2/9。也就是大约8TOPS
如果你的算法或者说CNN卷积需要的算力是1TOPS,而运算平台的算力是4TOPS,那么利用效率只有25%,运算单元大部分时候都在等待数据传送,特别是batch尺寸较小时候,这时候存储带宽不足会严重限制性能。但如果超出平台的运算能力,延迟会大幅度增加,存储瓶颈一样很要命。效率在90-95%情况下,存储瓶颈影响最小,但这并不意味着不影响了,影响依然存在。然而平台不会只运算一种算法,运算利用效率很难稳定在90-95%。这就是为何大部分人工智能算法公司都想定制或自制计算平台的主要原因,计算平台厂家也需要推出与之配套的算法,软硬一体,实难分开。
公众接受度
使用 了“丰田的防撞系统让普锐斯刹车 使用吉普切诺基的巡航系统来让车辆加速 利用吉普的自动泊车系统诱使汽车认为它正在停车,于是错误地转动方向盘,其实它是在以每小时 80 英里的速度行驶