自动驾驶专题报告:单车智能与车路云共发展,通信板块大有可为(附下载)
(精选报告来源:报告研究所)
一、AI 技术进步,推进单车智能自动驾驶高速发展
(一)具身智能应用场景落地,自动驾驶共通人形机器人技术
自动驾驶汽车是指通过集成计算机视觉、传感器、导航等系统,根据道路环境、周围 车辆、交通规则等信息,无需驾驶员进行干预,就能够实现自主决策、驾驶和安全操 纵的汽车。自动驾驶技术的基本原理包括以下四个方面:(1)感知:通过使用激光雷达、摄像头、毫米波雷达等传感器,获取车辆周围的环 境信息,包括道路、障碍物、行人等。(2)认知:通过使用计算机视觉和深度学习等技术,将感知到的环境信息进行分析 和处理,理解环境中的物体、障碍物、道路规则等。(3)决策:通过使用机器学习和规划算法等技术,对感知到的环境信息进行分析和 处理,制定车辆的行驶路线、速度、转向等决策,以及对不同情况的应对措施。(4)行动:通过使用控制算法和执行机构等技术,将决策转化为车辆的具体行动, 包括制动、转向、加速等。
自动驾驶汽车是具身智能的子集。具身智能是指在环境中具有实体的智能体,通过 与环境的交互来取得认知能力,学习并掌握新知识和新技能。对于自动驾驶与具身 智能的关系,清华大学智能产业研究院赵昊教授表示,“自动驾驶本身是具身智能 的一个子集,具身智能的移动能力就是自动驾驶”,并提出了“(自动驾驶)汽车就 是机器人”的观点。作为具身智能技术的两大应用场景,自动驾驶和人形机器人共 通“环境感知+规划决策+执行控制”三大关键技术。以特斯拉为例,特斯拉的Tesla Bot人形机器人,运用的就是与特斯拉自动驾驶相同的AI技术。
(二)大模型驱动自动驾驶技术迭代,“BEV + Transformer”成为主流
海外汽车制造厂商与科技公司纷纷布局无人驾驶。2013年,奥迪、福特、沃尔沃、 日产、宝马等众多汽车制造厂商,相继开始在无人驾驶汽车领域进行布局;2015年, 特斯拉推出了半自动驾驶系统Autopilot,也是第一个投入商用的自动驾驶技术;2016 年,Uber自动驾驶汽车在位于美国宾夕法尼亚州匹兹堡市的Uber先进技术中心正式 上路测试;2017年,Google Waymo对600辆克莱斯勒插电式混合动力Level 4级自 动驾驶汽车进行社会公测;2018年,奥迪A8是全球首款量产搭载Level 3级别的自动 驾驶系统的车型。
近十年我国自动驾驶汽车相继出现突破。2011年,一汽集团的红旗HQ3自动驾驶汽 车,完成了286km的面向高速公路的全程自动驾驶试验;2015年,宇通客车在完全开放的道路环境下完成自动驾驶试验,这也是国内首次大型客车高速公路自动驾驶 试验;2015年,百度自动驾驶汽车在北京进行自动驾驶测跑,完成了进入高速到驶 出高速不同道路场景的切换,最高车速达到100km/h;2016年,北汽集团在北京车 展上展示了其基于EU260打造的无人驾驶汽车;2018年,百度与厦门金龙合作生产 的首款Level 4级自驾巴士“阿波龙”已经量产下线并开始商业化运营。
大模型驱动自动驾驶技术迭代。自动驾驶技术可以分为感知、决策和控制三个模块。其中,感知模块关键部分,负责解析并理解自动驾驶所处车辆周边的交通环境,是 实现自动驾驶的基础和前提。感知模块的精准程度,直接影响并制约着自动驾驶系 统整体的安全性和可靠性。因此,感知模块也经历了多样化的模型迭代:(1)CNN(2011年-2016年):卷积神经网络(CNN)的输入通过两个卷积和子采 样阶段进行前馈处理,再通过线性分类器进行分类,显著提升了自动驾驶车辆的环 境感知能力。一方面,CNN在图像识别与处理方面表现卓越,使车辆能够准确分析 道路、交通标志、行人与其他车辆;另一方面,CNN能够有效处理多种传感器数据, 实现了图像、激光雷达等数据的融合,提供全面的环境认知。(2)RNN+GAN(2016年-2018年):循环神经网络(RNN)的循环结构可以建模 时间上的动态变化,有利于处理自动驾驶中的轨迹预测、行为分析等时序任务。生 成对抗网络(GAN)通过学习复杂分布生成高质量的合成数据,可以用于缓解自动 驾驶系统训练数据不足的问题。因此,RNN负责时序建模,GAN负责数据生成,两 者相互协同可以实现端到端的行为预测和运动规划。(3)BEV(2018年-2020年):鸟瞰视图(BEV)是将车辆周围的三维环境数据投 影到俯视平面上生成二维的鸟瞰图。一方面,BEV提供了更加直观和丰富的环境信 息,可以更清晰地观察道路、车辆、行人、标志等元素的位置和关系,增强自动驾驶 对复杂环境的感知能力;另一方面,全局的俯视视角更有利于路径规划和避障系统 进行决策,根据道路和交通状况规划更合理的路径。(4)BEV + Transformer(2020年至今):Transformer模型通过多层的自注意力机制和前馈神经网络实现对序列数据的特征提取,在处理序列数据和复杂上下文关 系方面展现出 独 特 优势 。2021 年,特斯拉在 AI Day 活动上展示了 BEV + Transformer架构的自动驾驶模型。BEV和Transformer的结合可以充分利用BEV提 供的丰富空间环境信息和Transformer的多源异构数据建模能力,实现更精确的环境 感知、更长远的运动规划和更全局化的决策。目前,各大车企纷纷布局“BEV + Transformer”架构,大模型成为自动驾驶算法的主流趋势。(5)Occupancy Network(2022年至今):占用网络模型(Occupancy Network) 是基于学习将三维曲面表示为深度神经网络分类器的连续决策边界,包括学习丰富 语义特征的编码器和生成三维场景表达的解码器,可以视作为对BEV二维图像的升 级迭代。2022年,特斯拉将占用网络模型应用到自动驾驶感知领域,实现更精准地 还原自动驾驶汽车行驶周围3D环境,提升了车辆的环境感知能力。
(三)全球首个单车智能自动驾驶系统,特斯拉 FSD V12 性能大幅提升
特斯拉FSD V12是全球首个单车智能自动驾驶系统。2023年8月26日,特斯拉创始 人兼首席执行官马斯克,首次在网络上直播试驾特斯拉的FSD V12自动驾驶系统。马斯克在直播中提到,FSD V12系统主要通过AI对8个HW3摄像头的视频进行实时 判断,从而对车辆进行控制,实现端到端的全自动驾驶。因此,FSD V12系统的代 码量减少了超过30万行,以每秒36帧的最大速度运行8个摄像头的功耗也仅需100W, 端到端的自动驾驶系统实现了大幅度的性能提升。
端对端方案对训练数据量提出更高要求。在传统的模块化方案中,自动驾驶系统将 整个智能驾驶任务进行切分,定义并划分出多个子模块,分别负责认知、决策和控 制等不同任务,再通过系统集成来完成整个智能驾驶任务。端到端方案则不再进行 模块和任务的划分,在接收到传感器的输入数据后,直接输出动作或轨迹的智能驾 驶决策。由于端对端方案主要依赖于神经网络的拟合精度,模型对训练数据量提出 了更高的要求,也对算力提出了更高的要求。
全球Robotaxi商业化运营进程加速。2023年,美国本土头部领先的自动驾驶技术公 司Cruise和Waymo相继获得了旧金山全天候商业运营无人驾驶出租车的运营牌照。该牌照的发放是自动驾驶行业的里程碑,标志着完全开放的Robotaxi商业化正式开 始在美国乃至全球首发落地。与此同时,Waymo积极迈出与运营平台合作商业化落 地的步伐,与Uber和捷豹三方合作在旧金山、菲尼克斯实现Robotaxi正式收费运营。
二、国内积极推进车路云,萝卜快跑商业化正加速
(一)百度推出 ACE 交通引擎,发挥 Apollo 车路协同能力
本报告文件将分享到报告研究所知识星球,扫描下方图片中二维码即可查阅
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
应广大粉丝要求,「报告研究所」成立了报告交流群,欢迎各位公司企业、投行、投资机构、政府机构、基金、创业者及金融资本圈朋友加入!
这里能且不限于:“行业交流、报告交流、信息交流、寻求合作等......”
入群方式:添加助理微信【touzireport666】,发送「个人纸质名片」或「电子名片」审核后即可入群。