虽然特斯拉AI Day才举办了两届,但由于干货太多,技术太过硬核,也被业内称为自动驾驶领域的春晚。
去年AI Day的关键词还是BEV、Transfomer和Hydranet,今年就变成了Occupancy Network,技术迭代能力惊人,而无论名词怎么变,特斯拉对于纯视觉路线的坚持丝毫没有动摇。反映在现实层面,随着AI神经网络架构越来越成熟,以及云端超算DOJO的推出,特斯拉在感知环节所需的硬件端可以实现“化繁为简”,成为100%的纯视觉派,因此,马斯克也被称为“雷达杀手”。2018年,马斯克嘲讽激光雷达是自动驾驶的“拐杖”、“鸡肋”和“阑尾”;2019年,马斯克又再下判断,“那些依赖激光雷达的人注定失败”。2020年,小鹏宣布要推出带激光雷达的P5时,马斯克甚至在推特上怒喷,随后何小鹏在微博上强硬回怼,声称要把特斯拉打得找不着北。到了2021年,特斯拉变得更加激进,当年5月宣布拿掉北美市场新生产的Model 3/Y上的毫米波雷达,在行业内引发了不少争议,上周,特斯拉将刀挥向超声波雷达。问题来了,在整个行业试图将更多、更强大的雷达装上车,为自动驾驶提供多传感器保障时,特斯拉为什么坚持一枚雷达也不要?难道仅仅只是因为“钱”的问题吗?
活太糙,价太高
特斯拉抛弃雷达的原因并不复杂,总结一下,要么是干活太糙,要么是要价太高。特斯拉官方认证的两个关键词则是:信噪比(信号与噪声的比例)与成本。率先被特斯拉砍掉的毫米波雷达,被拿下的理由就是信噪比太低。毫米波雷达的工作原理非常简单,发射无线电波,接收回波,然后根据时间差、相位差来测距、测速。但问题在于,主流车载毫米波雷达分辨率低,缺乏测高能力,且整个过程中伴随杂波干扰,这导致物体在探测结果中常常呈现为一个点(也可能一个点都没有,或者出现本不该有的杂点),很难判别形状和类别。这就好比让一个人蒙住双眼,只用一根手指头去摸索判断前方物体的属性,效果可想而知。汽车行业对毫米波雷达的使用大多是扬长避短,只取其对动态物体的追踪能力。但静态物体是它逃不开的噩梦,为了避免毫米波雷达把井盖、天桥等各种静止物体一概当做障碍物,行业基本会屏蔽其对静止物体的探测信号,不然会导致“幽灵刹车”的情况频发。因而在传统汽车毫米波雷达上,一个复杂的真实世界经常被降维成只有一些点的平面。
毫米波雷达眼中的世界
况且,特斯拉使用的毫米波雷达一直是大陆在2016年推出的入门级产品ARS 410,性能已经过时。在特斯拉近两年的技术框架中,毫米波雷达的探测信号经常成为感知系统中的“噪声”,污染感知数据,误导其他传感器,反而可能增加意外情况。
有这一铺垫,超声波雷达今年被特斯拉砍掉也显得顺理成章。某种程度上,超声波雷达更是劣化版的毫米波雷达——毫米波有的功能它没有,毫米波存在的问题它一个不少。其探测距离短(通常3米内),无法测速,也不能测出物体轮廓,主要优点是便宜(数十元一枚,一整套方案也不过几百块),能用在低速场景下,倒车、泊车时辅助防撞。相比于性能孱弱的毫米波和超声波雷达,激光雷达在信噪比问题上倒是有很大改善,大到特斯拉也悄悄用过这根“拐杖”。表面上对激光雷达嗤之以鼻的特斯拉,实际上在2021年给一批车辆安装过激光雷达,目的是利用后者精度极高的测量,帮助视觉算法进行校准。然而,这批车仅仅是测试车型,充其量激光雷达只在特斯拉打了一段时间临时工。
搭载激光雷达测试的Model Y
激光雷达自始至终没能登上特斯拉量产车,主要原因是另一个命门:成本太高。
成本杀手的理念刻在特斯拉的基因里。特斯拉创业之初选择18650圆柱电池作为动力电池,原因就是工艺成熟,价格低廉。更新的例子,是特斯拉在Model Y白车身上率先启用了后桥一体化压铸工艺,将原本七十个零部件一体成型,不仅降低重量,还将成本削减40%[1]。作为智能电动汽车第一抠厂,激光雷达的高成本让特斯拉难以接受。当前,一枚高性能激光雷达价格可达上万元,便宜的也要3000元[2],而一枚高清车载摄像头模组的价格仅400元[3],特斯拉自研的FSD芯片估算成本也才200美元。如果搭载激光雷达,特斯拉的智能驾驶硬件成本可能会直接翻倍,这和特斯拉“技术普惠”的愿景背道而驰。此外,除开信噪比与成本两个大头,雷达们还有其他问题:数据格式不同,标定、融合的技术门槛高,计算开销大;工作频率不同(激光雷达每秒10帧,摄像头每秒36帧),数据时间同步也是技术障碍。采取多传感器路线的车企,往往要供养数百甚至上千人规模的团队。而特斯拉将雷达悉数砍掉的破釜沉舟,则能背水一战,将资金与资源悉数聚焦到马斯克最信任的技术路线上——纯视觉自动驾驶。视觉“杀死”雷达
过去几年,特斯拉拒绝雷达的理由,说到底,还是因为它们降本增效的速度还不够快。故事的B面,则是特斯拉押下重注的纯视觉路线技术突飞猛进,快到在不到三年的时间里端了各种雷达的饭碗。
其实特斯拉早期的Autopilot走多传感器路线,理论上摄像头与毫米波雷达协同工作,实现辅助驾驶。但面对复杂情况时两者常常互撂挑子——毫米波雷达在水平方向盲人摸象,摄像头则是在一帧帧垂直图像上勉力识别,像极了两个二维生物在争吵这个世界该是横还是竖。
上图:毫米波雷达视野;下图:摄像头视野
这段时期也是特斯拉辅助驾驶事故的高发期。2016年特斯拉撞上一辆侧翻白色卡车的事件早已成为多传感器协作失效的经典案例:毫米波雷达盲人摸象失败,摄像头对特征模糊的卡车熟视无睹,人类驾驶员未做兜底,事故避无可避。
改变自2020年开始发生,特斯拉意识到依靠两个二维生物交换信息,很难准确还原三维世界。当年,特斯拉推出FSD beta,全面倒向潜力更高的摄像头,对智能驾驶算法进行重构:一方面,通过深度学习训练,让视觉算法学习对物体的距离和速度进行预估,获得初步的三维感知能力;另一方面,从鸟瞰视角将多枚摄像头获取的信息进行融合,同时加入时间维度,算法由此“活”在了更逼近现实的四维时空中。测速、测距本是毫米波雷达安身立命之本,这意味着,特斯拉视觉能力的出师之日,就是毫米波雷达失业之时。2021年5月,特斯拉北美车型上的毫米波雷达惨遭一锅端。当年6月,特斯拉人工智能总监Andrej Karpathy(今年已离职)作出解释——在实测中,视觉算法的测速测距能力,已经逼近甚至超越毫米波雷达[4]。而在今年,特斯拉的纯视觉算法更进一步,横空出世的占用网络(Ocuppancy Network),让摄像头把对手瞄向了更强的存在——激光雷达。基于纯视觉的占用网络算法将感知空间划分为一个个立体网格,通过检测网格是否被占用,以一种低算力开销、低计算延迟的方式,实现对物体体积的测算————包括让全世界智能驾驶团队头疼的各类异形物体。这解决了视觉感知“物体未识别则不存在”的经典难题。而在此之前,行业多认为昂贵激光雷达才是正确答案。
特斯拉占用网络精准探测了“前动后静”的超长巴士,这种目标在业内通常是难题
在视觉算法拥有了对标激光雷达的能力后,羸弱的超声波雷达在逻辑上也失去了存在的必要,顺势砍掉,将为特斯拉每辆车节省数百元的成本。特斯拉官方表示,超声波雷达走后,占用网络将接管其工作:随着算法更新,特斯拉难用的自动泊车能力将得到增强,而一直跳票的智能召唤也将随之到来。
至此,在特斯拉体系内摄像头与雷达的赛马中,摄像头通过算法的进化,完成了对雷达能力的模拟,以低成本实现了视觉雷达效果,一个顶仨。面对这种史诗级奋斗逼,雷达们只能相继毕业。只不过,有的雷达可能成为历史,有的雷达,则有望在改造之后,在特斯拉重新上岗。毫米波雷达再就业
今年6月和9月,特斯拉被发现向FCC(美国联邦通信委员会)提交的两款自研毫米波雷达认证申请已经通过,美国白客Green也在特斯拉车型的新物料清单中发现了毫米波雷达的身影。
特斯拉申请认证的自研毫米波雷达
问题是,特斯拉去年才把毫米波雷达裁了,为什么又要光速打自己的脸?
2019年,特斯拉推出了哨兵模式与宠物模式,这两个功能通过摄像头,在车主离开的情况下持续对车内、车外环境进行监测,用以防盗、保护车内宠物。然而功能在推出后,先后引起了挪威军方、柏林警方、中国政府的警惕,理由是高清摄像头可能造成隐私泄漏或者国家安全风险。而传统毫米波雷达的低分辨率特征,反而是一个优势——它能在不过分采集高精度数据的前提下,实现这些功能。比如特斯拉申请的60Ghz车内雷达,根据特斯拉提交的材料,它有几个和哨兵/宠物模式高度重叠的潜在用途:监测车内生命体征,可用于儿童感测(防止儿童被遗忘在车里);感知车外两米以内/破窗检测,用于防盗;进行手势识别,丰富车内交互形式[5]。因此这一型号的毫米波雷达,可能有助于特斯拉车型在推出新功能的同时满足各国隐私、数据合规要求。不过在技术党们看来,另一枚被特斯拉申请了保密的毫米波雷达才是重头戏。因保密令到今年12月才解禁,其具体参数和用途尚不清晰,但从已经公开的测试报告得知,这是一枚77Ghz雷达,在天线设置上采用了6收8发方案。这些信息将其身份指向了一种更先进的毫米波雷达——4D毫米波雷达,也叫成像雷达[6]。传统毫米波雷达被特斯拉从车上移除的原因,很大程度上是因为分辨率太低,难以完成对物体的精确检测和识别。但这个问题并非无解,一般来说工作频率越高、收发信道越多,毫米波雷达的分辨率就越高。自动驾驶高精度感知要求,在倒逼着毫米波雷达的精度不断进化,高分辨率雷达早已是热门技术,今年更是被称为4D毫米波雷达上车元年。在国内,上汽飞凡R7就搭载了来自采埃孚的4D毫米波雷达,智能驾驶效果进步明显——相比传统毫米波雷达只能在平面上生成少量点,4D毫米波雷达能够绘制立体空间中的点云图,这与激光雷达效果相似。
Arbe 4D毫米波雷达原型机效果,该公司曾与特斯拉进行技术合作
实际上,4D毫米波雷达是一种介于传统毫米波雷达和激光雷达之间的传感器,其感知精度显著优于前者,而成本可以低至后者1/10。特斯拉一向喜欢这样的性价比之选,毫米波雷达重归特斯拉在逻辑上其实很合理。
当下,尽管特斯拉的纯视觉智能驾驶算法已经取得长足进步,但其测速、测距仍然是基于深度学习的“估测”,且面对雨、雪、雾等天气可靠性会大打折扣。而毫米波雷达的测速、测距是基于物理原理的计算,并拥有全天候的探测能力。一枚信噪比显著提升的4D毫米波雷达,可以与特斯拉的摄像头实现能力互补,提升系统表现。其实,马斯克对毫米波雷达的态度也从未一棍子打死,今年初他在推特上互动时,留下了颇有暗示意味的回复:“高精度(毫米波 )雷达才是正解。”
尾声
特斯拉对雷达态度的反复横跳,可能会让一些吃瓜群众有些烧脑——不是说好了 All in 视觉吗,怎么说变就变?很久以来,群众对马斯克的“第一性原理”有些误解,认为“第一性原理”在特斯拉的表现就是模仿人类,人只靠视觉就能开车,因此自动驾驶也应该如此。实际上,特斯拉选择视觉为主的智能驾驶方案,原因一,是其能看到更丰富的信息(如颜色、语义,马斯克称为高数量级的“量子比特”),二是成本低廉。而技术的发展是动态的,只要达成或者逼近上述条件,不同的传感器会找到自己的用武之地。特斯拉对雷达的暧昧态度,也能反映出这家公司最真实的第一性原理——设立一个高难度的目标,然后找到最具性价比的工程手段实现它。(PS:国内特斯拉车型毫米波雷达、超声波雷达依然在岗,从未失业)
参考资料:
[1] 电动车企争相入局,一体化压铸为何被特斯拉带火,见智研究Pro
[2] 撞了电动车,掏空我钱包,品玩
[3] 自动驾驶驶入快车道,车载摄像头迎来量价齐升,东方证券
[4] CVPR 2021 Workshop on Autonomous Driving,Andrej Karpathy
[5] Federal Communications Commission DA 21-407
[6] 特斯拉再次拥抱雷达?凡知杂货铺