查看原文
其他

国产自动驾驶芯片,究竟做到哪一步了?

芯师爷 2023-10-25

The following article is from Auto Byte Author Auto Byte

文 |  华卫

来源 | Auto Byte

去年11月,在一场高峰论坛上,人们见证了数十款国产汽车芯片集中首发的盛况。在国际形势、国家政策,市场需求的三重推动下,汽车芯片赛道上热闹非凡。在这其中,自动驾驶芯片更是有着代表性的意义。
目前,英伟达和Mobileye两家国际厂商在自动驾驶SoC芯片市场占据主要席位。其中,英伟达是大算力芯片的“卷王”,自2015年进入自动驾驶领域以来,不断刷新算力“天花板”;Mobileye则一直深耕于辅助驾驶领域,在L2级及以下自动驾驶领域长期拥有领先份额。

另外值得一提的是,已在智能座舱芯片领域做到龙头位置的高通,如今也开始切入自动驾驶赛道,并快速拿下宝马、大众等多个头部客户的定点。

与此同时,国内企业也正在这一领域开疆扩土。近年来,地平线、黑芝麻智能、芯驰科技、寒武纪行歌等国内芯片厂商陆续崭露头角,还有传统ICT企业华为和造车新势力零跑汽车下场研发自动驾驶SoC芯片。

而美国政府在几个月前颁发的AI芯片禁令,更使得芯片国产化替代的风潮蔓延到汽车领域,给国产自动驾驶SoC芯片带来更多「上分」机会。

那么,当下国产自动驾驶SoC芯片发展到什么水平了?有能力“替代”目前国际主流的大算力芯片吗?各家国内本土厂商的竞争优势和产品定位是什么?车企真正会选择的又是怎样的芯片?

近日,Auto Byte从算力、能效比、算法效率、开发难易程度、成本以及量产情况等多个方面,梳理了国内几家活跃自动驾驶芯片企业的产品情况,并与其中三家芯片厂商的代表进行了深度探讨。

国产芯片要“上位”

先过这六关

据了解,国内芯片厂商中,目前2015年成立的地平线和2016年成立的黑芝麻均已推出可实现L2~L4级别自动驾驶的单芯片,芯驰也将在今年将其V9系列自动驾驶芯片产品的覆盖范围扩至L4/L5级。芯驰方面透露,L2级智能驾驶仍是目前车企和市场最关注、落地最多的功能。

对于高级别的智能驾驶系统而言,传感器数量的增加及分辨率的提升,带来海量数据的处理需求,算法模型的复杂程度亦大幅提升。在E/E架构集中化趋势下,智能汽车的计算能力将主要由少数的几个域控制器或是中央计算平台来实,这也对单颗车载芯片算力提出了更高的要求。

根据地平线数据披露,自动驾驶等级每增加一级,所需芯片算力就会呈现数十倍的上升。其中,L2级自动驾驶的算力需求为2-2.5TOPS,L3级自动驾驶算力则需达到20-30TOPS,到L4级需要200TOPS以上,L5级别算力需求更是超过2000TOPS。

不过,大算力也意味着更高的成本,因此,实际上中等算力的自动驾驶SoC芯片会更加受到车企的青睐,这也给正在起步发展的本土厂商提供了机会。

在芯片企业紧密推出的这些产品中,大家往往只关注算力数据。可事实上,在开发量产车型的过程中,除算力外,主机厂还会综合考量自动驾驶芯片的能效比、算法效率、软硬件适配性、处理器架构、IP配置和开发难度等方面,以对标车型的价格与定位

能效比控制

当前,行业普遍以“TOPS” 为单位来评估自动驾驶芯片的理论峰值算力,然而,在实际场景中,自动驾驶芯片的理论峰值算力基本不大可能会被完全释放,这是因为算力的有效利用率还受到芯片功耗表现和能效比控制的影响。

对比以上的数据,Auto Byte发现,能效比控制是不少国内自动驾驶芯片厂商的一个优势。而高能效比不仅能够为汽车节约大量的电力,还能产生更少的热能,有助于芯片的散热与高性能的稳定运行。

算法效率快慢

芯片峰值算力高,也有效释放了,就一定能真正提升自动驾驶系统的整体处理能力吗?答案是,未知。

如果芯片架构与算法的匹配度不够,导致自动驾驶算法的运行的效率极低,整个芯片里面大量的晶体管实际上是在空转,算力再大,实际处理能力也并不是最佳。

“现在人工智能的软件算法远没有达到L5的水平,用可支持L5的算力去匹配L2的算法,得房率肯定低。”地平线认为,算力与算法效率应当相匹配地发展,提供算法刚好吃掉的算力即可

此前,地平线CTO黄畅曾举过这样一个例子:芯片峰值算力相当于汽车的马力,驾驶员或者乘客能够真实体会到的是百公里加速度,而马力大的车并不一定加速就快。于芯片来说,用户可以感受到的是系统的处理能力和效率,而算力大并不一定算得快。

地平线一直更加推崇FPS(Frames PerSecond)的计算方式,即每秒准确识别帧率。据介绍,地平线的征程5芯片可达到1531FPS,华为昇腾可达到829FPS,而英伟达Orin仅为208FPS。

“算力只是一个理论上限,最终芯片能发挥出多少效率,还取决于软件算法配合等多方面的因素。在整车生命周期和产品售卖过程中,芯片算力往往都不能完全发挥,甚至可能连一半都发挥不了。”芯驰也向Auto Byte传达了类似的观点。

基于这一问题,芯驰做了两方面的工作。一是提供SDNN工具,可以将不同算法分配到最适合运行的IP上,如CPU或GPU;二是自研UniLink总线技术,从硬件层面实现高效的数据分发机制,减少异构核之间的数据传输时间消耗。

此外,黑芝麻还谈到制约芯片算法效率的一个现象。现在市面上多数AI硬件加速单元是以单一加速单元为主,不同大小模型无法同时得到相应的加速,容易导致大模型推理时间长、小模型利用率低。

针对这一问题,黑芝麻自研了具有中大算力能力和多维异构架构的NPU,使得不同模型都有相应的硬件加速单元做加速,计算效率更高。

处理器架构方案

架构方面,目前市面上主流的自动驾驶芯片SoC架构方案分为三种:(1)CPU+GPU+ASIC,如英伟达和特斯拉;(2)CPU+ASIC,如Mobieye和地平线;(3) CPU+FPGA,如Waymo和百度昆仑芯。

业内普遍认为,从发展趋势来看,自动驾驶SoC芯片将向“CPU+XPU”的异构式架构发展;长期来看,在自动驾驶算法尚未成熟固定之前,CPU+GPU+ASIC的架构仍会是主流,成熟后,定制批量生产的低功耗、低成本的专用自动驾驶AI芯片(ASIC)将逐渐取代高功耗的GPU,CPU+ASIC方案会是未来的主流架构。

采用“CPU+ASIC”架构的地平线,自主设计研发了Al专用处理器架构Brain Processing Unit(BPU),客户可以在此基础上进行自动驾驶软硬件系统和整车的开发。

据介绍,BPU采用大规模异构计算、高灵活大并发数据桥和脉动张量计算核等技术,来打造适应端侧自动驾驶需求的矩阵运算,目前已推出了五种三代AI架构:高斯架构、伯努利1.0架构、伯努利2.0架构、贝叶斯架构,下一代征程6芯片将集成第四代BPU架构:纳什架构。

目前,黑芝麻采取的是多核异构的计算架构,其综合算力、功耗以及功能完整性要求在芯片处理器上使用8核A55方案,并在内部集成自研的ISP和NPU,还有GPU、DSP以及功能安全和信息安全MCU,在提供强大算力的同时,确保不同类型的计算都有相对应的最优计算单元做加速,使得芯片可以承担图像拼接渲染、传感器融合和功能安全等复杂功能,能够用单芯方案承担行车和泊车的功能。

同样采取多核异构架构的芯驰对Auto Byte表示,这一设计更均衡,通盘考虑了CPU、NPU、GPU、MCU算力需求和能力,可以应对自动驾驶/ADAS从感知到规划控制的完整流程。目前自动驾驶系统主要还是依赖CPU进行路线规划与决策,而执行这些决策需要实时/可靠的控制能力,也就是MCU算力。

异构IP配置

由于当前自动驾驶芯片多采用多核异构的架构,需要不同类型的运算IP,包含GPU、NPU和CPU等,异构IP配置在芯片设计中尤为重要。

但配置IP并不是算力越高就好,其涉及整个芯片的设计和验证,需要兼顾带宽、外设、内存等方面。而且,在设计芯片的过程中,需要根据芯片内部的处理数据流,来帮助客户在每一个运算步骤上做硬件优化。

根据公开信息,国内厂商里,黑芝麻通过自研两大自主可控核心IP构建起一定优势,包括NeuralIQ ISP图像信号处理器及高性能深度神经网络算法平台DynamAI NN引擎。

其中,NeurallQ ISP可以支持多达16路高清相机接入,在自动驾驶环境较为恶劣的情况下(雨雪、雾天等),依旧能实现高动态曝光、低光降噪、LED闪烁抑制等高质量车规图像处理要求;而DynamAI NN引擎能够实现软硬件同步优化,平衡好算力和功耗,具有支持稀疏加速和配备自动化开发工具等优势,能够高效快速地处理更多图像类数据。

软硬件适配性

智能汽车在持续发展,所搭载的传感器等硬件设备以及软件操作系统都在不断更新,自动驾驶SoC芯片的适配性是一个绕不开的话题。

「汽车智能驾驶是个庞杂的产业链,涉及芯片、算法、软件、系统、硬件、协议栈、云端等各个层面。每个领域都需要考虑到快速迭代和升级的需求。」芯驰方面表示。

据介绍,芯驰的自动驾驶平台UniDrive采用了通用计算硬件加速,能够兼容不同自动驾驶算法路线。而且,从算法到硬件,UniDrive都非常开放,不限制主机厂对自动驾驶的定义,L1到L4都可以基于该框架做相应设计。

在底层,UniDrive支持QNX、RTOS等主流车规OS以及Linux;模块层,UniDrive能够兼容Adaptive AutoSAR、ROS、Cyber等框架。

黑芝麻也建立了开放的芯片产品生态,既支持黑芝麻自研OS/中间件/视觉感知算法,又支持第三方软件移植,不绑定传感器/软件/MCU等。此外,黑芝麻提供ISP(摄像头)调试适配服务,能够与主流OS/中间件/视觉感知算法第三方供应商进行前期适配。

地平线则是从三个层面来完善其芯片产品的适配性。

在去年12月的媒体沟通会上,黄畅曾详细介绍,首先,地平线芯片本身有各种丰富的高、低速接口,能够适配传感器、Camera、LiDAR、Radar、PMIC、不同Tier2以及MCU等周边关键器件;其次,在底层软件上,地平线开放了相关周边设备的驱动,客户可以在软硬件层面上完成与周边硬件的适配;最后,在算法应用开发上,地平线通过完善算法工具链,让生态合作伙伴能够在比较开放的条件下共同完成算法和应用开发以及系统集成适配工作。

不同于国内芯片厂商,英伟达的自动驾驶SoC芯片则是基于自身GPU所开发,并与CUDA操作系统强绑定,车企需在此基础上去开发自动驾驶的软硬件系统。

开发便捷性

芯片作为算力基础设施,要服务客户做算法开发,好芯片更得是「好用」的芯片。

当前,英伟达既对外售卖所开发的完整自动驾驶系统,也允许车企单独购买自动驾驶SoC芯片,并为其提供了多种可供调用的成熟算法、基础软件堆栈以及DRIVE Hyperion Developer Kit自动驾驶开发套件。

Mobileye则从封闭的黑盒方案逐渐转为开放模式,在去年7月发布了软件开发工具包EyeQ Kit,让合作车企可以自主开发EyeQ 6H和EyeQ Ultra两款芯片,同时依然提供无需自研的芯片方案。

而国内的自动驾驶SoC芯片厂商,一直以来秉持的都是开放共创打法,并不断向车企放开更多的合作模式与开发权限。

“我们会提供相应的开发套件,相当于Tier1.5的服务体系,可以快速支持Tier1拿到一个准量产的硬件。”地平线称。

(地平线天工开物AI芯片工具链)

据介绍,地平线构建了以「芯片+工具链」为核心的高效开放技术平台,包含硬件参考设计、工具链、 AIDI开发平台、基础中间件和丰富的参考算法等。通过开放易用的AI开发工具与基础设施,生态伙伴能够基于地平线芯片在短时间内完成从硬件到软件、从感知到规控的全栈自动驾驶功能开发。

例如,在地平线的助力下,鉴智机器人仅用了不到2个月的时间,就迅速实现了整个系统各项感知指标的量产级要求。

为配合推出的华山系列自动驾驶计算芯片,黑芝麻先后发布了山海人工智能开发平台和瀚海自动驾驶中间件平台,通过成熟的工具链和中间件体系支撑车企快速量产。

据悉,山海平台提供适配芯片架构的AI编译器的自动优化,支持TensorFlow、Pytorch、ONNX等,还拥有50多种AI参考模型库转换用例,支持动态异构多核任务分配与客户自定义算子开发;瀚海自动驾驶中间件平台是一款智能驾驶平台SDK开发包,包含Target(SoC)SDK、X86(Host 主机)SDK、Target(MCU)端SDK,可以支持车端、路端及各种智能驾驶和车路协同场景开发。

芯驰则在其芯片研发中作了许多本土化的设计,提供敏捷开放的产品研发平台,兼容性也较好。此外,芯驰还打造了完整的芯片生态系统,涵盖软件类、工具协议类、生态视觉以及整体解决方案,共有200多家生态合作伙伴。

成本“四分”

直面“上车”大考

站在车企的角度上,在选择自动驾驶SoC芯片时,不仅会对比产品本身的性能表现,更看重需要付出的整体成本。而事实上,要评判这一指标需要考虑到四个方面:芯片本身价格、能效比、开发成本以及供应保障成本

第一是芯片成本,用了这颗芯片以后的系统价格会是多少。

第二是能效比,其代表着芯片本身的性价比,「好芯片」能够带给客户超出预期的结果。地平线对Auto Byte表示,如果100TOPS的芯片实现了200TOPS芯片能够达到的自动驾驶体验,那么这对于车企和消费者来说都更具性价比。

“就像马力大不代表加速性能好,算力大并不等于最终自动驾驶的功能体验好。”

而在能效比方面,黑芝麻和地平线等国内芯片厂商都推出了不亚于英伟达Orin和特斯拉FSD这类国际主流大算力芯片的产品。(具体对比数据可见上文的《自动驾驶SOC芯片能效比》一表)

第三是芯片开发成本,例如,芯片的研发费用投入人数和时间是多少,研发难度有多大。

“Tier1或者车企拿到芯片是以500人/月的时间和人力成本完成开发,还是以5000人/月的成本完成开发?如果芯片好用易开发,能够实现快速部署,那么对于车企来说,也是极具性价比的选择。”地平线表示。

黑芝麻也以华山二号A1000和A1000L为例谈到,这两个芯片均是pin2pin兼容,可以让车厂在不同方案产品迁移过程中,省去更多的人力和物力投入。

第四是供应保障成本。芯驰向Auto Byte指出,不专为汽车所设计的芯片生命周期较短,可能3-5年就不供货了。但车规的供应一般都要有10年的保障,如果不能保障后续的供应,车厂后续的成本会变高,要重新设计芯片系统才能满足车型的持续销售。

量产情况

当前,地平线的征程2已在长安UNI-T、长安UNI-K、奇瑞蚂蚁、上汽智己、广汽埃安AION Y等车型前装量产,不过只有奇瑞蚂蚁将该芯片应用于自动驾驶,其余都用在智能座舱上。

而征程3已在2021款理想ONE上车,用于实现L2级自动驾驶和NOA导航辅助驾驶功能。征程5则在理想L8 Pro首发量产,除理想外,该芯片还获得比亚迪、上汽、一汽红旗等多项定点。

黑芝麻的华山二号A1000也在经过两年的软硬件打磨验证之后,完成全部量产认证。2022年5月,黑芝麻与江汽集团达成平台级战略合作,华山二号A1000芯片将搭载在多款思皓品牌量产车型。

而早在2022年9月就宣布在研3款自动驾驶芯片的寒武纪行歌,也有量产消息传出。据悉,其第一款自动驾驶芯片已经流片,并已与一汽达成合作,之后会搭载到一汽某自主品牌的车型上。

另据芯驰方面透露,目前其V9系列芯片也已获得多个量产定点, 不过暂不对外官宣合作的具体车企。此外,芯驰提到,他们正在与纵目科技合作开发某主机厂的定点项目。

本土优势下

各家厂商如何定位自身?

不可否认,国内本土化自动驾驶芯片厂商的发展势头越来越猛,也已经撬开市场的一角。但面对英伟达、Mobileye、高通等国际芯片巨头多年的技术和客户储备,国内厂商如何能守住当下的“一隅之安”,并持续打开市场空间呢?

共同优势

长期以来,由于英伟达、高通有着完整的开发工具链和良好的上下游合作关系,其技术迭代速度非常快。为保持这样的竞争优势,他们所推出的芯片在设计上会偏通用型,应用领域更广,并非是针对自动驾驶专门开发。

因此,国内芯片厂商有机会通过更聚焦于自动驾驶领域的特异性算法,在整体性能上实现赶超。而且,国内厂商还具有本土化服务能力的优势,能够更好地与本土的主机厂进行沟通,了解国内市场的真实需求后定义出来的产品也能更好地量产上车。

另外,地平线、黑芝麻等国内芯片厂商普遍提供较为开放的生态,以满足车企的定制化需求和提升软件算法自研能力的需求。

对于自动驾驶技术来说,封闭的生态显然不利于其快速迭代。以Mobileye为例,其过去以黑盒交付为主,封闭性太强,虽然可以实现快速量产,但从长期来看,这样做难以满足主机厂的定制化需求,且其算力升级较为保守、迭代速度慢,Mobileye也因此流失部分客户。

各家厂商定位

除共同的本土化优势之外,国内自动驾驶芯片厂商也在逐渐建立各自的市场定位。俗话说,「种瓜得瓜,种豆得豆」。各家厂商选择的产品路线不一,最终对标的车型和应用也就不同。

目前,地平线有征程2、征程3和征程5三款已经实现前装量产的自动驾驶SoC芯片。地平线表示,其中征程5是专为高等级自动驾驶应用打造的高性能、大算力车规级芯片。

根据公开信息,征程2所搭载车型的价位多在10万-20万元左右,征程3所搭载车型的价位约在35万元,征程5所搭载车型的价位则在35万-40万元。

据悉,黑芝麻的产品定位是针对自动驾驶的通用计算芯片,其拥有两个自研核心IP,并致力于在芯片硬件设计的功能、成本以及功耗等方面做到均衡。

黑芝麻还对Auto Byte透露了华山二号系列芯片的对标车型,其表示,华山二号A1000L和A1000可以分别以单芯片方式,支持从低阶5V5R到高阶10V5R的行泊一体方案,覆盖入门级车型和高附加值车型。

芯驰方面则介绍,其产品定位是适合面向大规模量产的车规级芯片,其V9系列芯片综合考虑用户体验、算法和芯片的结合和优化,集成了高性能CPU、3D GPU、AI引擎,采用高可靠双核锁步机制,以单芯片方案实现APA/ADAS方案,旨在平衡性能和成本。

尽管中国自动驾驶SOC芯片厂商的起步较晚,但从现在公布的产品信息和量产情况来看,国产芯片已经逐渐呈现出有实力替代海外芯片产品上车的势头,甚至已经装进了像理想L8 Pro这样40万左右的豪华SUV车型。

不过,多数国产自动驾驶SOC芯片目前还处于拿到定点的阶段,其量产车型暂未上市,是否能够经受住市场的考验仍不能下定论。要想在国内站稳脚跟,乃至逐步出海,也绝非一朝一夕之功。

- END -

本文转载自 Auto Byte,内容仅供交流学习之用,如有任何疑问,敬请与我们联系info@gsi24.com。

▼ 往期精彩回顾 ▼

“中国激光雷达第一股”,今夜美股IPO!

蔚小理驶出弯道

由于缺芯,该国暂停新护照制作签发

2022年半导体市场:增长的销售额 VS 收紧的巨头们

忆芯科技:优秀的国产企业级SSD如何脱颖而出

又一半导体巨头加入裁员潮!

这是一场积蓄已久的盛会……

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存