汽车AI芯片专题报告:自动驾驶核心,本土龙头崛起
1、中国汽车智能化加速发展,具备 AI 能力的主控芯片和计算平台成为发展核心
1.1 特斯拉引领汽车智能化加速发展,汽车算力需求爆发式增长,汽车行业将掀起算力军备竞赛
特斯拉引领行业生态革命,消费者对辅助驾驶接受度提升,对汽车智能化、网联化程度关注度空前提升。 2019 年 4 月特斯拉 FSD 计算平台横空出世,以 144 TOPS 算力的全自动驾驶双冗余(单芯片算力为 72 TOPS) 引领车载芯片市场,重新定义智能汽车时代核心技术,也标志着特斯拉正式步入 HW3.0 时代,而在底层算力大 幅升级同时,伴随 AutoPilot 平台升级的还有新增的辅助驾驶功能,如自动辅助变道、自动辅助导航驾驶、智能 召唤、识别交通信号灯和停车标志并做出反应以及城市街道自动辅助驾驶等。2016 年到 2019 年特斯拉车载计 算平台的算力从 0.256 TOPS 到 144 TOPS,从每秒只能处理 36 帧图像到每秒能够处理 2300 帧,其智能化的功 能也在同步实现跨越式升级。根据巨量引擎-汽车数据策略研究院整理,消费者在购车时对智能化和网联化的关 注度越来越高,2019 年相比 2018 年,对汽车智能化关注度同比增长 30.8%。而在汽车辅助驾驶和智能安全配置 需求度上,对自适应巡航、盲区监测、倒车辅助系统、碰撞缓解刹车系统、防疲劳驾驶、360 度全景泊车等功 能的配置需求都达到了 70%以上。同时 80%的消费者关注语音识别的准确性、地图精准度等问题。
汽车电子电气 E/E 架构加速向域控制、中央计算平台架构迁移。博世认为汽车电子电气架构演变路径为分 布式、域集中、中央集中式。传统汽车分布式架构缺点越来越明显,高档车使用 100~200 种不同 ECU,汽车的 EEA 中搭载了各种功能不同的 ECU 进行协同运作为驾驶员提供各种功能,打造中央集中式 EEA 架构的车载计 算平台,面临“功能安全、实时性、带宽瓶颈、算力黑洞”等多种挑战。目前车厂逐步将一些 ECU 功能合并到 一个 ECU 中,减少控制节点,控制器向“域”集成方向发展,目前车辆上主要有动力域、车身域、自动驾驶域、 底盘域和信息娱乐域,域控制器可以完成各自域内协调工作,便于软件管理和车辆变形。域集中和中央计算平 台架构使原来分散的算力集中化,在降低架构复杂度同时提高了系统算力,软硬件解耦让汽车软件实现即插即 用,具备可持续迭代升级的能力。在电子电气架构方面,目前特斯拉发展最为领先,其新一代集中式 E/E 架构 达到车载中央电脑和区域控制器阶段,配合自研的操作系统,可实现整车 OTA。目前相对传统车企 E/E 架构, 特斯拉领先五年以上。其他主机厂如大众、奥迪、通用、丰田等车企都在加快部署全新 E/E 架构,量产时间大概在 2021-2025 年。比如大众 ID.3 将搭载名为 E³的 E/E 架构,并将出现跨域中心控制器,实现域融合架构;通用新一代 E/E 架构 Global B,将搭载在全新凯迪拉克 CT5 上;丰田则将采用 Central & Zone 的 E/E 架构。
零部件成本下降、中低端车竞争加剧,推动 ADAS 渗透率在中国市场快速提升,自主品牌 ADAS 装配量大 幅提升。5 年前在一些高端车型上才有 ADAS 功能。2015 年以来,电子器件成本不断下降,消费者倾向于选择 安全性能更高的、配备智能驾驶辅助功能的汽车。现在中低端车型,尤其是自主品牌,ADAS 的装配率已经越 来越高了,尤其是 FCW 前方碰撞预警系统、AEB 自动紧急制动系统、ACC 自适应巡航、LDW 车道偏离预警 系统、DMS 疲劳驾驶预警系统等多项功能装配率不断提高。ADAS 的渗透率快速提升来自于几方面动力:1) ADAS 相关的硬件成本近年来快速降低,例如毫米波雷达尤其是 77GHz 的毫米波雷达价格比五年前降低了超过 50%;2)CNCAP 把一些基本的 ADAS 功能如 AEB 放入评价体系也在客观上有力推动了这些功能的普及;3) 中低端车竞争加剧,造成主流合资和自主品牌的重点车型上 ADAS 功能的搭载率甚至超过了一些在华销售的高 端品牌车型。预计未来中国市场智能驾驶辅助功能的渗透率将持续快速提升,中低端汽车配置的智能驾驶辅助 功能项目将逐步增多。根据 Strategy Analytics 预测 ADAS 功能在我国乘用车中渗透率将从 2019 年的不到 20% 提高至 70%以上;自动泊车目前车型渗透率较低,未来提升空间较大。根据汽车之家大数据统计,30 万以下车 型渗透率远不足 20%,预计 2025 年可以达到 50%左右的渗透率。
汽车电子电气架构变化、自动驾驶快速普及,汽车算力需求爆发式增长,汽车行业正在掀起算力军备竞赛。 智能驾驶汽车涉及到传感器环境感知、高精地图/GPS 精准定位、V2X 信息通信、多种数据融合、决策与规划 算法运算、运算结果的电子控制与执行等过程,此过程需要一个强劲的计算平台统一实时分析、处理海量的数 据与进行复杂的逻辑运算,对计算能力的要求非常高。目前一般认为,L2 需要的计算力<10TOPS,L3 需要的计算力为 30~60TOPS,L4 需要的计算力>100TOPS,L5 需要的计算力目前未有明确定义(有预测需要至少1000TOPS),每增加一级自动驾驶等级算力需求增长一个数量级,根据 Intel 推算,全自动驾驶时代,每辆汽车每天产生的数据量高达 4000GB。为了更好的智能驾驶表现,计算平台成为汽车设计重点,车载半导体价值量快速提升,汽车行业掀起算力军备竞赛。以行业龙头特斯拉为例,近日媒体报道,特斯拉正与博通合作研发新款 HW4.0 自动驾驶芯片,预计明年第四季度就将大规模量产,新一代芯片采用 7nm 工艺。预计 HW4.0 算力有望达到432 TOPS 以上,超过 HW3.0 的三倍以上,将可用于 ADAS、电动车动力传动、车载娱乐系统和车身电子四大领域的计算,成为真正的“汽车大脑”。Gartner 的数据显示,全球汽车半导体市场 2019 年销售规模达 410.13亿美元,预计 2022 年有望达到 651 亿美元,占全球半导体市场规模的比例有望达到 12%,并成为半导体细分领域中增速最快的部分。
1.2 主控芯片和计算平台成为汽车智能化发展核心,车载 AI 芯片是皇冠上的明珠
软件定义汽车趋势下,主控芯片和计算平台成为汽车智能化发展核心。汽车智能计算平台是依靠高性能计算技术和高可信软件技术,实时认知外部环境,并实现对整车最优决策和控制的计算系统。汽车智能计算平台作为汽车的“大脑”,一端衔接芯片、传感器、通信模块、底盘控制电子、车身控制电子等传统汽车电子核心环节,另一端衔接网络通信、数据融合、计算处理、决策规划等汽车电子新兴领域。无论是交通工具层面的升级,还是移动服务终端层面的演进,汽车智能计算平台都起到至关重要的作用。计算平台和主控芯片成为打造新型智能汽车电子产业重中之重。
硬件架构升级驱动芯片算力需求呈现指数级提升趋势,汽车需要处理大量图片、视频等非结构化数据,同时处理器也需要整合雷达、视频等多路数据。这些都对车载处理器的并行计算效率提出更高要求,具备 AI 能力的主控芯片成为主流,汽车主控芯片结构形式也由 MCU 向 SOC 异构芯片方向发展。
现阶段用于汽车决策控制芯片和汽车智能计算平台主要由三部分构成:1)智能运算为主的 AI 计算单元;2)CPU 单元;3)控制单元。主控 SoC 常由 CPU+GPU+DSP+NPU+各种外设接口、存储类型等电子元件组成,现阶段主要应用于座舱 IVI、域控制、ADAS 等较复杂的领域。现有车载智能计算平台产品如奥迪 zFAS、特斯拉 FSD、英伟达 Xavier 等硬件均主要由 AI(人工智能)单元、计算单元和控制单元三部分组成,每个单元完成各自所定位的功能。目前AI 芯片可选用 GPU、FPGA、ASIC(专用集成电路)AI 芯片等。当前完成硬件加速功能的芯片通常依赖车载操作系统(多用 Linux 或 QNX)进行加速引擎及其他芯片资源的分配、调度。
汽车主控 SoC 系统级芯片需求逐年增长,目前呈现出传统汽车芯片厂商和 ICT 厂商群雄逐鹿的竞争格局,中国公司有望凭借出色的 AI 能力占据重要地位。瑞萨电子、恩智浦、德州仪器等传统汽车芯片企业是当前量产环节的主导力量,凭借深厚的汽车芯片设计经验,在嵌入式计算处理器领域与汽车软件、系统开发商深度绑定,能够更好地协同车辆控制,把控功能安全需求。因为汽车智能化快速发展,英伟达、高通、Intel 近年来在汽车主控芯片领域大举布局,现已跻身全球汽车半导体前 25,主打 ADAS、自动驾驶以及智能座舱领域的芯片设计,具备传统芯片企业难以比拟的算力优势。除 Intel Mobileye 的 EyeQ 系列芯片广泛应用于 ADAS、高通骁龙 820A、SA8155P 大量应用于车机系统。我国企业主要发力 AI 计算领域,基于人工智能领域的研究突破,开发出一系列面向自动驾驶、座舱智能化应用的处理芯片,已经有企业突破了车规级认证阶段,正式获得商用和前装量产。以地平线征程系列芯片、华为昇腾芯片为代表的集成度更高、功能更复杂、集成 AI 处理单元等异构计算模块的 SOC 引领车规 AI 芯片的发展。
AI 芯片部署的位置有两种:云端和终端。云端 AI 应用主要用于数据中心,在深度学习的训练阶段需要极大的数据量和大运算量,因此训练环节在云端或者数据中心实现性价比最高,且终端单一芯片也无法独立完成大量的训练任务。终端 AI 芯片,即用于即手机、安防摄像头、汽车、智能家居设备、各种 IoT 设备等执行边缘计算的智能设备。端 AI 芯片的特点是体积小、耗电少,而且性能不需要特别强大,通常只需要支持一两种 AI能力。AI 的实现包括两个环节:训练、推理。所以根据承担任务的不同,AI 芯片可以分为:用于构建神经网络模型的训练芯片,利用神经网络模型进行推理预测的推理芯片。训练芯片受算力、经济效率考虑,一般只在云端部署。相比训练芯片,推理芯片考虑的因素更加综合:单位功耗算力,时延,成本等等。AI 发展初期推理也采用 GPU 进行加速,但由于应用场景的特殊性,依据具体神经网络算法优化会带来更高的效率,FPGA/ASIC的表现可能更突出。
随着自动驾驶渗透率快速提升,预计车载 AI 芯片市场规模超过手机侧 AI 芯片规模。随着智能化对算力需求的指数级增长,ADAS 功能逐步成为智能汽车标配,预计到 2025 年 70%的中国汽车将搭载 L2-L3 级别的自动驾驶功能。观研天下预测全球自动驾驶汽车上的 AI 推理芯片,其市场规模将从 2017 年的 1.42 亿美元,年均增长 135%至 2022 年的 102 亿美元,相比之下手机侧 AI 芯片市场规模为 34 亿美金,汽车 AI 芯片市场规模远超手机侧。部署于边缘的 AI 芯片/内置单元的市场规模占比将从 2017 年的 21%,上升到 2022 年的 47%。其 年均增速 123%,超过云端部署年均增速的 75%。GPU 市场份额将从 2017 年的 70%下降到 2022 年的 39%,其主要增长动力将从数据中心算法训练,转移到自动驾驶汽车。
人工智能时代车规级 AI 芯片成为皇冠上的明珠,竞争壁垒高。终端侧的 AI 芯片,车规级 AI 芯片是皇冠上的明珠。由于车规级标准极难认证,车规级人工智能芯片代表了芯片行业中的最高标准,与消费级和工业级芯片相比,车规级 AI 芯片在安全性、可靠性和稳定性上都有最高的要求。必须要达到,车载环境温度在-40℃到 125℃区间,故障率为 0。因为对安全性、可靠性的要求高,所以芯片从设计到车上测试验证、真正实现量产一般需要至少 4~5 年。由于车规级芯片开发周期长、设计难度大,属于长跑创新,一旦建立起领先优势,龙头厂商将具有较高的竞争壁垒,人工智能时代车规级 AI 芯片成为皇冠上的明珠,领先厂商竞争壁垒较高。
车载 AI 芯片市场空间大、重要性高,行业内新老玩家共争霸,中国涌现出以地平线、华为为代表的车规级 AI 芯片龙头。目前全球有 60 多家公司处于开发或销售专用处理器以加速 AI 应用程序发展的高级阶段,美国、中国、欧洲和以色列,软硬件行业巨头都在组建工程团队进行深度开发,从传统芯片巨头、互联网公司、创业企业选择了不同的赛道和应用场景加入竞争。目前车规级 AI 芯片行业中,海外代表性公司包括特斯拉、英伟达和 Mobileye,国内自主品牌代表性企业包括地平线、华为等。中国目前拥有全球最顶尖的 AI 算法人才、最愿意尝试创新的用户、最丰富的应用场景、广泛的数据来源和全球领先的工业化能力,未来国内必将走出自主品牌车规级 AI 龙头,目前已经具有先发优势的地平线有望引领行业发展。
2、地平线作为国内车规级 AI 芯片龙头,迎来黄金发展期
2.1 地平线成为中国本土首个实现正式商用量产的智能座舱和 ADAS 芯片提供商,通过“软硬结合”能力提供极致能效比的 AI 芯片
地平线具有领先的人工智能算法和芯片设计能力,通过软硬结合,设计开发高性能、低成本、低功耗的边缘人工智能芯片及解决方案,面向智能驾驶和 AIoT ,地平线可提供超高性价比的边缘 AI 芯片、极致的功耗效率、开放的工具链、丰富的算法模型样例和全面的赋能服务。依托行业领先的软硬结合产品,地平线向行业客户提供“芯片 + 算法 + 工具链”的完整解决方案。在智能驾驶领域,地平线同全球四大汽车市场(美国、德国、日本和中国)的业务联系不断加深,目前已赋能合作伙伴包括奥迪、博世、长安、比亚迪、上汽 、广汽等国内外的顶级 Tier1s ,OEMs 厂商;而在 AIoT 领域,地平线携手合作伙伴已赋能多个国家级开发区、国内一线制造企业、现代购物中心及知名品牌店。目前基于创新的人工智能专用计算架构 BPU(Brain ProcessingUnit),地平线已成功流片量产了中国首款边缘人工智能处理器--专注于智能驾驶的 “征程(Journey)”系列处理器和专注于 AIoT 的 “旭日(Sunrise)” 系列处理器,并已大规模商用。
车规级芯片道路上,公司有超强的耐心和长远规划的战略能力,2020 年 6 月长安 UNI-T 上市标志着公司的征程二代成为中国首个车载商用量产的 AI 芯片,万里长征路已经取得领先。相比其他 AI 芯片新秀一开始就进入手机、摄像头等消费级场景希望快速实现收入增长,地平线选择了一条最困难的道路,挑战 AI 行业的珠穆朗玛峰——车规级 AI 芯片,并进入与传统芯片巨头搏杀的赛道。自 2015 年创立以来,地平线仅用了 5 年的时间即实现了车规 AI 芯片的量产落地,开启国产车规级 AI 芯片的前装量产元年。公司目前拥有多个主机厂定点项目订单,2020~2023 年预计将迎来全面的收入和业绩爆发式增长。考虑到样片流片、车规级认证和车型导入的时间,地平线成立 5 年即实现车规 AI 芯片量产在整个汽车电子行业都处于领先位置。与此相比,Mobileye的车规芯片从研发到正式商用历时 8 年;作为全球通用 AI 芯片龙头的英伟达,在 CUDA 发布后 9 年才将 K1芯片应用于奥迪 A8 的车用系统。
征程系列芯片可以同时支撑智能汽车智能座舱 AI 应用和自动驾驶应用,应用于智能座舱域和自动驾驶域,最终成为中央计算平台主控芯片。目前征程二代可支撑 L2 自动驾驶应用,下一代芯片将支持 L3/L4 自动驾驶应用。未来智能座舱走向交互方式升级,例如车内视觉(光学)、语音(声学)以及方向盘、刹车踏板、油门踏板、档位、安全带等底盘和车身数据,利用生物识别技术(车舱内主要是人脸识别、声音识别),来综合判断驾驶员(或其他乘员)的生理状态(人像、脸部特征等)和行为状态(驾驶行为、声音、肢体行为),做到让车真正“理解”人,座舱演变成全面“个人助理”。因此地平线去年发布的征程二代芯片拥有强大的智能座舱多模感知算法支撑能力,并在 2020 年 4 月上市的长安 SUV 车型 UNI-T 上正式商用,目前 UNI-T 智能座舱功能如视线亮屏、分心提醒、疲劳监测、智能语音拍照等均已达到成熟稳定的高标准用户体验。目前征程二代能够对多类目标进行实时检测和精准识别,并提供高精度且低延迟的感知输出,可满足自动驾驶视觉感知、视觉建图定位、视觉 ADAS 等智能驾驶场景的需求,以及语音识别,眼球跟踪,手势识别等智能人机交互的功能需求。可以同时跑超过 60 个分类任务,每秒钟识别目标数可以超过 2000 个,因此完全可以满足 L2 级别智能驾驶的各类视觉应用需求,预计 2020 年~2021 年将会看到正式搭载征程系列芯片实现 ADAS 功能的量产汽车。
对于车载 AI 芯片来说,算力指标重要,能效比更重要。在传统芯片行业,PPA(算力、功耗和面积)是最经典的性能衡量指标。因为现在汽车自动驾驶对算力的追求,业界往往会把峰值算力当作衡量 AI 芯片的主要指标。地平线提供一个新的方法用以评估芯片的 AI 真实性能——MAPS (Mean Accuracy-guaranteed ProcessingSpeed,在精度有保障范围内的平均处理速度),针对应用场景的特点,在精度有保障的前提下,包容所有与算法相关的选择,评估芯片对数据的平均处理速度。MAPS 评测方法,关注真实的用户价值,将每颗芯片在‘快’和‘准’这两个关键维度上的取舍变化直观地展现出来,并在合理的精度范围内,评估芯片的平均处理速度。这个方法具有可视化和可量化的特点。
地平线致力于打造极致 AI 能效,芯片设计上能效比行业领先。未来一辆自动驾驶车辆平均每天产生600-1000 TB 的数据计算,仅 2000 辆自动驾驶车辆产生的数据量超过 2015 年我们整个文明一天数据用量,大规模设备端部署需要成本效率。要实现大规模部署,尤其在汽车初始售价逐步下降的情况下,车载 AI 芯片需要充分考虑芯片的能效比。地平线在 AI 处理器设计的初始就开始从整个芯片的系统级设计和芯片级别角度上思考SoC 的设计思路,将经典芯片设计思想和带宽利用率优化结合在一起,注重真实的 AI 能力输出,既守住主效能又兼顾灵活效能的 BPU 思想。以 2020 年最先商用量产的地平线征程二代芯片为例,搭载自主创新研发的高性能计算架构 BPU2.0(Brain Processing Unit),可提供超过 4TOPS 的等效算力,典型功耗仅 2 瓦,且具有极高的算力利用率,典型算法模型在该芯片上处理器的利用率可以高于 90%,能够高效灵活地实现多类 AI 任务处理,对多类目标进行实时检测和精准识别,可全面满足自动驾驶视觉感知、视觉建图定位、视觉 ADAS 等智能驾驶场景的需求,以及语音识别,眼球跟踪,手势识别等智能人机交互的功能需求,充分体现 BPU 架构强大的灵活性。作为通用 GPU 的代表供应商英伟达的自动驾驶系列芯片,通过添加神经网络单元,以实现对 AI 处理越来越高效,但总体而言 GPU 仍功耗较高。丰富的通用模块虽可实现对各种场景的适用性,但也带来了成本过高、功耗过高的问题。征程二代芯片具备极高的算力利用率,每 TOPS AI 能力输出可达同等算力 GPU 的 10 倍以上。与此同时,征程二代还可提供高精度且低延迟的感知输出,满足典型场景对语义分割、目标检测、目标识别的类别和数量的需求。
2.2 地平线 AI 算法能力全球领先,建立开放软件生态,高效的开发效率保证ADAS 芯片创新升级
公司 AI 算法能力全球领先,在对自动驾驶和汽车智能化重要应用场景的关键算法发展趋势进行提前预判,前瞻性地将其计算特点融入到计算架构的设计当中。AI 算法是车规 AI 芯片的灵魂,也对芯片设计带来了更大的挑战,神经网络算法的迭代速度远超硬件的改进速度,一旦设计时考虑不当,将会造成芯片设计结束时算法全面落后的情况,需要针对 ADAS 应用进行极致优化。地平线创始人余凯博士是全球最顶尖的 AI 专家,地平线拥有全球领先的算法团队,前瞻性的对重要应用场景中的关键算法发展趋势进行预判,提前将其计算特点融入到计算架构的设计当中,使得 AI 处理器经过一两年的研发,在推出的时候,仍然能够很好地适应时下最新的主流算法。因此和其他典型的 AI 处理器相比,地平线的 AI 处理器,随着算法的演进趋势,始终能够保持相当高的有效利用率,从而真正意义上受益于算法创新带来的优势。全球领先的 AI 算法能力是公司区别于 AMD、瑞萨、高通等传统芯片制造商的最大优势。公司掌握了算法和计算架构,再利用自己开发的编译器对算法和芯片同时进行极致优化,释放出所有的潜能。
高效的 AI 开发平台和工具链,帮助 OEM 和 Tier1 厂商更高效实现 AI 相关应用开发。目前传统主机厂都在加强软件团队建设,将 AI 解决方案集成到未来产品中,目前存在比较高的门槛,因此地平线在 2020 年 4 月公司推出了全新一代“天工开物”(Horizon OpenExplorer™ Platform)AI 开发平台。“天工开物”AI 开发平台基于自研 AI 芯片打造,由模型仓库(Model Zoo)、AI 芯片工具链(AI Toolchain)及 AI 应用开发中间件(AI Express)三大功能模块构成。平台包含了一整套有数据、训练、部署在内的算法开发流程,并开发出一套全栈式的 AI 平台工具用来高效地支撑这套开发流程。同时也标志着公司开放软件生态建立的第一步正式迈出,未来将全面建设围绕自身芯片+工具链的开发者生态。地平线甚至提供大量优秀的算法模型和原型系统,作为参考样例提供给客户。通过这些工具和样例,客户可以照猫画虎,快速地进行产品所需的算法开发,并持续迭代,由浅入深地进行全方位地调优,探索客户自己在数据和算法方面的独特价值,做出差异化和定制化。目前 SSD、Yolo v3、Faster RCNN、UNet、Mask RCNN、ResNet50、ResNet18、MobileNet v1、MobileNet v2 均已面向合作伙伴开放。
3、以地平线为代表的本土 AI 芯片厂商有望在中国市场击败 Mobileye占据较高市场份额,在自动驾驶时代助力本土车厂实现快速转型
3.1 全球范围看特斯拉 AI 芯片发展迅速,英伟达、Mobileye 竞争实力较强
为了更好实现智能化和自动驾驶功能,特斯拉从使用第三方主控芯片走上自研道路
为了掌握自动驾驶话语权,同时并掌握核心数据和 AI 算法,过去 5 年特斯拉经历了外购主控芯片到自研的道路。2014 年~2016 年,特斯拉配备的是基于 Mobileye EyeQ3 芯片的 AutoPilot HW1.0 计算平台,车上包含1 个前摄像头+1 个毫米波雷达+12 个超声波雷达。2016 年~2019 年,特斯拉采用基于英伟达的 DRIVE PX 2 AI计算平台的 AutoPilot HW2.0 和后续的 AutoPilot HW2.5,包含 8 个摄像头+1 个毫米波雷达+12 超声波雷达。2017年开始特斯拉开始启动自研主控芯片,尤其是主控芯片中的神经网络算法和 AI 处理单元全部自己完成。2019年 4 月 ,AutoPilot HW3.0 平台搭载了 Tesla FSD 自研版本的主控芯片,这款自动驾驶主控芯片拥有高达 60 亿的晶体管,每秒可完成 144 万亿次的计算,能同时处理每秒 2300 帧的图像。
这款 FSD 芯片采用 14nm 工艺制造,包含一个中央处理器、1 个图像处理单元、2 个神经网络处理器,其中中央处理器和图像处理器都采用了第三方设计授权,以保证其性能和稳定性,并易于开发,关键的神经网络处理器设计是特斯拉自主研发, 是现阶段用于汽车自动驾驶领域最强大的芯片。中央处理器是 1 个 12 核心 ARMA72 架构的 64 位处理器,运行频率为 2.2GHz;图像处理器能够提供 0.6TFLOPS 计算能力,运行频率为 1GHz;2 个神经网络处理器运行在 2.2GHz 频率下能提供 72TOPS 的处理能力。为了提升神经网络处理器的内存存取速度以提升计算能力,每颗 FSD 芯片内部还集成了 32MB 高速缓存。NPU 的总功耗为 7.5 W,约 占 FSD 功耗预算的 21%。这使得它们的性能功率效率约为 4.9TOPs/W,特斯拉在芯片设计方面充分考虑了安全性,一块典型的自动驾驶电路板会集成两颗 Tesla FSD 芯片,执行双神经网络处理器冗余模式,两颗处理器相互独立,即便一个出现问题另一个也能照常执行,此外还设计了冗余的电源、重叠的摄像机视野部分、各种向后兼容的连接器和接口。FSD HW 3.0 的性能比上一代 HW 2.5 提高了 21 倍,而功耗降低 25%,能效比 2TOPS/W,是现阶段用于汽车自动驾驶领域最强大的芯片和计算平台。
新一代自动驾驶芯片和 HW4.0 即将在明年量产,重构 AutoPilot 底层架构,将推出训练神经网络超级计算机 Dojo,瞄准 L5 自动驾驶场景。2020 年 8 月多家媒体报道,特斯拉正与博通合作研发新款 HW 4.0 自动驾驶芯片,有望在明年第四季度大规模量产,未来将采用台积电 7nm 技术进行生产。同时 AutoPilot 团队正对软件的底层代码进行重写和深度神经网络重构, 包括对数据标注、训练、推理全流程的重构。全新的训练计算机 Dojo正在开发中。Dojo 将专门用于大规模的图像和视频数据处理,其浮点运算能力将达到 exaflop 级别(秒运算百亿亿次),将配合无监督学习算法,来减少特斯拉对于数据人工标注的工作量,帮助特斯拉数据训练效率实现指数级提升。目前特斯拉已经拥有超过 82 万台车不断回传数据,到 2020 年年底将拥有 51 亿英里驾驶数据用于自动驾驶训练,过去的训练数据依赖于人工标注,而主动的自监督学习配合 Dojo 计算机可以大幅优化算法提升的效率。Dojo 可以改善 Autopilot 的工作方式,从目前的 2D 图像 + 内容标注方式训练,升级到可以在「4D」(3D加上时间维度)环境下运行。我们预计借助强大的自研计算平台、全球领先的 AI 算法能力、庞大的实际驾驶数据量,特斯拉有望成为率先实现L5级别自动驾驶的公司。
ADAS 市场领导者 Mobileye 提供成熟极具性价比软硬一体化 ADAS 方案,但开放性现在成为发展瓶颈
Mobileye 成立于 1999 年,是以色列提供基于视觉系统分析和数据处理研发高级驾驶辅助系统和自动驾驶解决方案的全球先行者,为全球 27 家 OEM 厂和 Tier1 厂商提供“芯片+算法”软硬一体化的 ADAS 视觉解决方案。EyeQ 系列芯片截至 2019 年底出货 5400 万,为全球超过 5000 万辆汽车的行车安全保驾护航,目前全球 ADAS市场占有率大约为 70%。创办之初公司致力于用单目视觉,提供包括行人检测、车道保持和自适应巡航等辅助驾驶技术,1999 年到 2001 年,Mobileye 原型产品每年迭代一次,2001 年 Mobileye 将自研的算法固化到芯片上并集成到汽车当中,从此开启了 EyeQ 芯片的研发。2004 年 4 月,EyeQ1 开始生产,随后公司收获多轮融资,将商业模式转向汽车安全,陆续与大陆、意法半导体、麦格纳、电装、德尔福等全球顶级零部件供应商签署合作协议。2007 年,宝马、通用和沃尔沃成为首批配装 Mobileye 芯片的车企,Mobileye 产品正式商用。2008 年,Mobileye 对外发布 EyeQ 2,公司进入稳定发展期。2013 年,Mobileye 累计卖出产品突破 100 万台,随后出货量呈现爆发式增长。2017 年 3 月,Mobileye 被芯片巨头英特尔以 153 亿美元的价格收购。2014 年到 2019 年,公司营收复合增速达到 44%,2019 年收入 8.79 亿美元,净利润 27.9%,其中 EyeQ 系列芯片 2019 年出货量达到 1740 万颗。EyeQ1 至 EyeQ4 等芯片型号已经量产,EyeQ5 则预计于明年投放市场。EyeQ4 多用于对半自动辅助驾驶技术的支持,最高支持到 L3 级别,而 EyeQ5 主要定位于 Level 4/5 无人驾驶阶段的应用。
EyeQ4 配置了 4 个 CPU 内核和 6 个矢量微码处理器(VMP),每个 CPU 内核又拥有四个硬件线程。EyeQ4芯片引入了新颖的加速器类别:两个多线程处理集群(MPC)内核,两个可编程宏阵列(PMA)内核。结构上,EyeQ4 使用 28nm 的 FD-SOI。功能上,相比 EyeQ3,EyeQ4 新增 REM 路网收集管理、驾驶决策、任意角度车辆识别、可行驶区域等功能。即将投放市场的 EyeQ5 将装备 8 枚多线程 CPU 内核,同时还会搭载 18 枚 Mobileye的下一代视觉处理器。EyeQ5 具有更为复杂的功能,将采用 7nm 制程工艺。EyeQ5 最多支持 20 个外部传感器(摄像头、雷达或激光雷达),“传感器融合”是 EyeQ5 推出的主要目的。EyeQ5 运算性能达到了 12Tera/每秒,能耗不到 5W,芯片节能效率是对标产品 Drive Xavier 的 2.4 倍。为了能够运行 L4/L5 级别自动驾驶,英特尔自动驾驶系统将采用摄像头为先的方法设计,搭载两块 EyeQ5 系统芯片、一个英特尔凌动芯片以及Mobileye 软件。EyeQ5 有望实行“开放”战略,Tier1 和主机厂等合作伙伴都可以使用“开放式架构”来写入自己的代码,包括传感器融合和驾驶决策等。目前 Mobileye 一直采用传感器+芯片+算法绑定的一体式解决方案,这种封闭模式也导致客户开发灵活度下降,短期有利于提升市场占有率,受到转型较晚或者 AI 投入少的 OEM 厂商欢迎,但长期将导致定制差异化产品的能力欠缺,因此需要快速迭代升级产品的造车新势力或者对转型速度要求较快的OEM 厂商很难接受 Mobileye 的“黑盒”方式。例如中国造车新势力小鹏汽车曾短暂地用 Mobileye 的芯片做过测试后决定在 P7 上改用英伟达的 Xavier,主要因为小鹏希望“把芯片和算法剥离开,采用可编程的芯片,在芯片上进行算法研发和定制化,跟场景结合”,因此选择了更开放的英伟达。
拥有庞大开放软件生态的 AI 芯片巨头英伟达瞄准 L3 级以上自动驾驶市场
英伟达是全球最大的智能计算平台型公司,公司从早期专注 PC 图形计算,后来逐步将重点扩展到 AI 领域,并在 3D 图形的持续需求与游戏市场规模扩张推动下,利用 GPU 架构,创建 VR、HPC(高性能计算)、AI 平台。英伟达在独立显卡、GPU领域有超过70%的市场份额。除了优秀的硬件性能外,英伟达开发了基于GPU的“CUDA”开发平台,CUDA 工具包包括了 GPU 加速库、编译器、开发工具等,为开发者提供丰富的开发软件 SDK,支持现有的大部分的机器学习、深度学习开发框架,开发者可以在 CUDA 平台上使用自己熟悉的开发语言进行应用开发。在不改变硬件的前提下,通过软件和库的完善,过去 2 年英伟达将计算性能提升 4 倍,AI 性能提升 2倍,所需的开发时间大幅缩短。公司花费了大量时间培养自己的开发生态,包括与高校合作培训专业人才、开展专业竞赛,培养、发展英伟达“GPU+CUDA”的开发者群体,形成了相当可观的产品使用人群, 2019 年全球已经有超过 160 万 CUDA 开发者。中国 CUDA 开发者数量众多,数量也增长最快,目前已经超过了 30 万,并且还在以每个月新增 1 万人的数量增长。2020 财年英伟达实现总收入 109.2 亿美元,其中汽车部门收入 7 亿美金,占总收入比例 6.4%,同比增长 9%。
在自动驾驶领域,英伟达提供芯片+开放软件生态,提供包括 Drive AV、Drive IX、Drive Sim 等软件在内的完整的开发者套件。2017 年 1 月,英伟达发布用于自动驾驶领域 Xavier 系统级 SOC 芯片, Xavier 拥有超过 90亿个晶体管,配置了一个 8 核 CPU、一个全新的 512 核 Volta GPU、一个深度学习加速器、全新计算机视觉加速器、以及全新 8K HDR 视频处理器,针对自动驾驶数据量做了特殊的设计和优化,采用了 16nmFinFET 工艺,功耗为 30W,算力达到 30TOPS。2020 年 4 月上市的小鹏汽车 P7,成为首款搭载 NVIDIA DRIVE AGX Xavier自动驾驶平台的量产车型,小鹏 P7 配备了 13 个摄像头、5 个毫米波雷达、12 个超声波雷达,集成开放式的NVIDIA DRIVE OS 操作系统。
2019 年 12 月英伟达发布了新一代面向自动驾驶和机器人领域 Orin 芯片和计算平台,可扩展、可编程,具有 ARM Hercules CPU 内核和英伟达下一代 GPU 架构。Orin SoC 包含 170 亿晶体管,晶体管的数量几乎是 XavierSoC 的两倍,具有 12 个 ARM Hercules 内核,将集成下一代 Nvidia GPU,提供 200 TOPS@INT8 性能,接近 XavierSoC 的 7 倍,Orin SOC 将在 2021 年提供样片,2022 年正式面向车厂量产。2020 年 5 月 GTC 上,英伟达介绍了即将发布的新一代自动驾驶 Drive 平台,Drive 平台如果搭载两个 Orin SoC 和两块 NVIDIA Ampere GPU,可以实现从入门级 ADAS 解决方案到 L5 级自动驾驶出租车(Robotaxi)系统的全方位性能提升,平台最高可提供2000TOPS 算力。
3.2 以地平线为代表的本土车载 AI 芯片公司凭借独特优势有望击败 Mobileye 等海外厂商,助力本土车厂实现快速智能化转型
车载 AI 芯片行业对芯片和 AI 解决方案提供商要求较高,需要至少具备以下能力:1)较强的神经网络算法能力,智能汽车主控芯片核心是神经网络单元的设计;2)自动驾驶汽车计算单元设计需要考虑算力、功耗体积等问题,同时做到芯片设计、算法最优化,有效算力最大;3)有能力提供“软硬一体”平台级解决方案,需要建立足够开放生态使 OEM 厂商和 Tier1 可以进行二次开发,同时为客户提供感知、制图、行驶策略等解决方案。目前全球主流车载 AI 芯片提供商都具备较强的软硬一体能力,和对 AI 算法、芯片设计的理解,本土厂商追赶的速度很快。
我们重点分析本土厂商地平线与 Mobileye 的区别和各自特点:Mobileye 虽然拥有成熟和高性价比的L1~L2+ ADAS 视觉方案,芯片+算法软硬一体捆绑销售的方式在主机厂软件开发能力较差的初期阶段受广泛欢迎。随着 ADAS 场景复杂度提升,这种方式灵活度较差,客户难以做出差异性产品,也没有办法按照自己的自动驾驶规划目标来设计方案。尤其对于需要快速转型、对自动驾驶升级迭代速度要求较高的 OEM 厂商、造车新势力,需要芯片和算法分离,可以进行二次开发。由于系统封闭性,Mobileye 摄像头产生的原始数据是以Mobileye 的特殊格式保存的,必须要用 Mobileye 自己的工具链才能打开,2017 年特斯拉和 Mobileye 分道扬镳的很大原因还是因为 Mobileye“黑匣子”式商业模式难以满足特斯拉对自动驾驶快速升级的个性化要求。同时Mobileye 在中国没有本土服务团队,都是由以色列团队出差到中国提供服务,服务影响速度较慢。相比之下地平线拥有完整的算法、芯片、工具链一体化的服务能力,拥有专门的软件算法团队协助车厂开发,并向车厂开放算法与软件能力,采取联合开发、共同投入的方式,既能提升主机厂的能力,也能避免 Mobileye“黑盒”销售方式,为本土客户提供良好的服务。作为中立第三方,芯片和算法可分开销售或一体式解决方案,为国内主机厂提供将芯片和算法分别进行定制化的解决方案也是未来快速占领市场、建立技术生态的较好方式。对比之下,地平线和英伟达一样,采用较为开放的软硬件体系,并且生态在快速建设过程中。
2019 年我国汽车产销量均超 2500 万辆,其中自主品牌车厂市占率 37.9%继续下降。随着日德车企、特斯拉等新造车实力的竞争加剧,自主品牌车厂拥有更强的汽车智能化创新动力和诉求,亟需一批有力的 AI 芯片合作伙伴帮助他们提升智能化水平和能力,实现向汽车智能化的快速转型和反超。在车规级 AI 芯片的战役中,地平线已经取得了绝对的优势和领先成果,在 AI 芯片性能、算法、商业化等方面均走在行业前列,加速量产进度、提升量产规模,实现国产替代和车规 AI 芯片自主化责无旁贷。长期来看,地平线将在中国市场成为自主品牌车厂快速向智能化和自动驾驶转型道路上最有力的合作伙伴,也将在本土市场全面超越 Mobileye,成为本土车规级 AI 芯片的龙头。
4、投资建议
全球范围看特斯拉 AI 芯片发展迅速,英伟达、Mobileye 竞争实力较强,以地平线为代表的本土车规级 AI芯片公司有望在中国市场击败 Mobileye,助力中国主机厂实现自动驾驶快速转型。经历了 2019 年 4 月 HW3.0和 FSD 的震撼发布后,特斯拉新一代自动驾驶芯片和 HW4.0 即将在明年量产,重构 AutoPilot 底层架构,将推出训练神经网络超级计算机 Dojo,瞄准 L5 自动驾驶场景。目前特斯拉已经拥有超过 82 万台车不断回传数据,到 2020 年年底将拥有 51 亿英里驾驶数据用于自动驾驶训练我们预计借助强大的自研计算平台、全球领先的 AI算法能力、庞大的实际驾驶数据量,特斯拉有望成为率先实现 L5 级别自动驾驶的公司。ADAS 市场领导者Mobileye 提供成熟极具性价比软硬一体化 ADAS 方案,但开放性现在成为发展瓶颈。目前 Mobileye 一直采用传感器+芯片+算法绑定的一体式解决方案,这种封闭模式也导致客户开发灵活度下降,短期有利于提升市场占有率,受到转型较晚或者 AI 投入少的 OEM 厂商欢迎,但长期将导致定制差异化产品的能力欠缺,因此需要快速迭代升级产品的造车新势力或者对转型速度要求较快的 OEM 厂商很难接受 Mobileye 的“黑盒”方式。2019 年12 月英伟达发布了新一代面向自动驾驶和机器人领域 Orin 芯片和计算平台,可扩展、可编程,具有 ARM HerculesCPU 内核和英伟达下一代 GPU 架构。Orin SoC 包含 170 亿晶体管,晶体管的数量几乎是 Xavier SoC 的两倍,具有 12 个 ARM Hercules 内核,将集成下一代 Nvidia GPU,提供 200 TOPS@INT8 性能,接近 Xavier SoC 的 7倍。凭借强大的软硬件实力,我们预计英伟达有望成为自动驾驶领域 AI 芯片领导者。地平线拥有完整的算法、芯片、工具链一体化的服务能力,向车厂、Tier1 开放算法与软件能力,为本土客户提供良好的服务。作为中立第三方,芯片和算法可分开销售或一体式解决方案,为国内主机厂提供将芯片和算法分别进行定制化的解决方案。地平线和英伟达一样,采用较为开放的软硬件体系,并且开发者生态还在快速扩大过程中。长期来看,地平线将在中国市场成为自主品牌车厂智能化转型道路上最有力的合作伙伴,也将在本土市场全面超越 Mobileye,成为本土车规级 AI 芯片的龙头。我们建议投资重点关注自动驾驶 AI 芯片和算法领域取得领先优势的特斯拉、英伟达、地平线。
……
(报告观点属于原作者,仅供参考。作者:中信建投,石泽蕤)
为便于研究人员查找相关行业研究报告,特将2018年以来各期文章汇总。欢迎点击下面红色字体查阅!
文琳编辑
今日导读:点击下面链接可查阅
公众号 :文琳行业研究
文琳行研报告,为各机构提供专业的信息、数据、研究和咨询服务。欢迎关注【文琳行业研究】
《文琳资讯》每日提供最新信息。欢迎关注
今日导读:点击下面链可查阅
《文琳阅读》每晚经典,欢迎关注!
今日导读:点击下面链接可查阅
公众号 :就业与创业