黑芝麻:国产自动驾驶芯片独角兽,用芯赋能未来出行(深度)| 国君计算机李沐华
行业深度系列
— 作者:李沐华、齐佳宏 —
1. 国产自动驾驶芯片独角兽,用芯赋能未来出行
1.1. 加速技术革新,打造行业领先水准
黑芝麻智能科技是一家专注于视觉感知技术与自主IP芯片开发的企业。公司主攻领域为嵌入式图像和计算机视觉,提供基于光控技术、图像处理、计算图像以及人工智能的嵌入式视觉感知芯片计算平台,为ADAS及自动驾驶提供完整的商业落地方案。
抓住大算力芯片机遇,加速国产芯片突围。随着自动驾驶的感知精度、控制精度和响应速度要求不断提高,大算力主控芯片需求将大幅上涨。作为国产芯片的领跑者之一,公司也抓住了这一机会,成立五年来专注于研发大算力自动驾驶芯片,发布了华山系列2代4颗高性能自动驾驶芯片产品,形成了两大核心IP及FAD自动驾驶计算平台的端到端、全栈式自动驾驶解决方案。黑芝麻智能的目标就是研发性能最强、算力最高的国产自动驾驶计算芯片,提供自动驾驶、车路协同解决方案。
成果显著,行业影响力快速提升。在中国智能网联汽车产业创新联盟中,黑芝麻智能科技作为核心成员,承担核心IP、芯片及部分解决方案研发任务;2018年公司成功入选“2018中国汽车智能网联创新力量50强”和“2018中国人工智能创新成长企业50强”。2020年,黑芝麻加入百度Apollo开放生态,双方将基于华山系列自动驾驶芯片展开深入合作。同年,黑芝麻入榜“2020胡润中国瞪羚企业”和“CB Insights中国芯片设计企业65强”。
黑芝麻智能近年来的发展进程梳理如下:
2019年8月,公司首发自研车规级芯片华山一号,该芯片在算力峰值、能效比、算力利用率等关键性能指标上超越了Mobileye的EyeQ4;
2020年6月,华山二号A1000自动驾驶计算芯片发布。该芯片算力达58-116TOPS,是第一款可以支持L2+自动驾驶的国产芯片,也是国内第一款通过功能安全认证的自动驾驶计算芯片;
2020年8月,黑芝麻智能与一汽智能网联开发院签署技术合作协议,双方联合研发基于华山二号A1000的智能驾驶平台,加速了国产智能驾驶芯片的产业化落地;
2021年4月,黑芝麻智能发布华山二号A1000 Pro。该方案算力能够达到106-196TOPS,继续保持国内最高算力自动驾驶芯片的位置,这也使得黑芝麻智能成为了国内第一家推出两款满足ISO26262车规功能安全标准的高算力自动驾驶芯片厂商。
业务快速发展引得资本青睐,公司正式迈入独角兽行列。业务的快速发展也使得公司获得了资本的青睐,小米和博世先后投资,其中对黑芝麻的投资是小米宣布造车以来在自动驾驶芯片领域的首笔投资,也是博世在我国自动驾驶芯片行业的第一笔投资。2021年9月,在完成数亿美元战略轮及C轮融资后,公司投后估值接近20亿美元,正式迈入独角兽行列。
1.2. 精心打磨产品体系,建设安全开放生态
精细打磨自研产品,技术创新加速出圈。黑芝麻智能基于自动驾驶所需的感知算法、核心IP、芯片系统架构、工具链、操作系统等技术生态圈,花了三年时间打磨其第一颗芯片——华山一号 A500,并于2019年发布。公司掌握了大算力、低功耗、高算力利用率及完整SOC设计能力等核心技术,其多芯片互联FAD板卡算力高达160T。
完善开发工具链,提升芯片易用性。除不断锤炼芯片自身性能以外,公司还积极开发工具链,以提升芯片易用性。为了配合华山系列自动驾驶芯片,公司发布了山海人工智能开发平台,该平台有50多种AI参考模型库转换用例,能够有效降低客户的算法开发门槛,实现QAT和训练后量化的综合优化,使得算法模型精度得到保证,支持动态异构多核任务分配,支持客户自定义算子开发。
公司打造国内首款通过功能安全认证的自动驾驶芯片。黑芝麻智能对华山二号A1000芯片进行了独立车规级安全岛设计,并且通过R-Lock双冗余互锁架构与多重可靠性设计,不仅可以提供全方位信息安全体系,还可以支持硬件加密。该芯片于2020年7月通过了ISO26262功能安全产品ASIL-B级别认证,又于2021年6月通过了ASIL-D级别认证,功能安全体系得以逐步建立。
打造开放超算平台,助力优化产品体系。公司打造的FAD作为高低速融合一体超算平台,具备高可靠、低时延、大带宽、双冗余和前融合等技术优势,同时也具有开放性的特点。第三方公司开发的算法亦可搭载在黑芝麻智能芯片上,利用后者提供的神经网络开发工具直接进行原始网络的硬件合成或进行包括剪裁和再训练在内的网络的深度优化,从而达到支持不同的客户、推向不同的场景的目的。
1.3. 自研IP制胜,构筑核心竞争力
另辟蹊径,先IP后芯片。与国内大多数芯片公司不同的是,公司并没有从一开始就进行芯片研发,而是从自研核心IP入手,旨在缩短芯片设计周期、节约设计成本、降低芯片设计难度、提高产品的性能和可靠性。对公司而言,有两个IP异常重要,分别是高性能图像处理IP和低功耗神经网络IP,这两个IP能够帮助自动驾驶系统在复杂的光线环境下依然保持对于外部环境信息的准确感知,从而最大程度地发挥神经网络的算力。
自研的ISP,助力自动驾驶系统“看得更清楚”。如A1000芯片的ISP每秒能够处理1.5亿像素,通过它对摄像头感知的信息进行处理后,后端计算可以更加均一化,不会因为光照、阴影等差异影响感知效果。
自研的NPU让自动驾驶系统将看到的场景“理解清楚”。A1000芯片的NPU算力能够达到58TOPS(INT8),主要用于对传感器感知后的数据进行识别,并基于此对车辆、车道线以及其他交通参与者数据进行分析。
1.4. 原生“车芯”基因,彰显出圈底气
团队既懂车又懂芯,起跑线领先。公司创始人单记章拥有超过20年视觉和芯片技术经验积累,也是世界知名的图像芯片公司 OV(Omni Vision)的创始团队成员。联合创始人刘卫红则担任过博世底盘事业部亚太区的负责人。研发团队横跨了芯片和汽车两个行业,整个研发团队已经接近600人,半数以上来自国内外顶级学府。核心团队来自博世、OV、英伟达、安霸、微软、高通、华为、中兴等业内顶尖公司,使得黑芝麻智能创立之初便拥有了踏入技术门槛高、设计及开发难度大的自动驾驶赛道的底气。
2. 芯片性能极具竞争力,积极布局各级自动驾驶市场
2.1. 芯片性能快速升级,定位L3级以上市场
黑芝麻华山系列感知芯片性能演化的路线分为三个阶段:
1. 2019年发布A500芯片。该芯片是28纳米的工艺,能够提供5到10 TOPS的算力,功耗小于3瓦。
2. 2020年陆续发布了华山二号A1000和A1000L,针对L3、L4自动驾驶。A1000是16纳米工艺,算力40-70TOPS,满足ASIL-B的功能安全等级。在运行主流的神经网络时,整个芯片的功耗不足8瓦。A1000L针对L2.5级自动驾驶场景,算力16 TOPS。相对于A1000,A1000L的算力和接口类型要稍微弱一些,相应地,其功耗大概只有5瓦。
3. 2022年预计将发布下一代华山三号A2000的芯片,面向 L4、L5级别自动驾驶的芯片,预计采用7nm 的工艺,算力单片200TOPS。同时它也会支持128b lpDDR5,带宽会达到几百兆每秒,预计会达到ASIL-C级别的功能安全等级。
除了自研核心IP之外,A1000芯片中还集成了CPU、GPU、DSP等。A1000芯片的CPU算力能够达到32K DMIPS,其GPU能够实现6-12万面3D渲染能力,此外还有5颗DSP,用于数字信号处理。
2.2. 华山系列芯片及平台布局各级市场
华山一号A500 SoC是一款高性能、低功耗应用于图像传感、实时计算机视觉和神经网络处理的ASIC平台,专为各种嵌入式应用而设计,以基于摄像头的汽车传感和人工智能计算为核心,如Level-2 ADAS或DMS系统。
控制器功耗略大,能效比更高。华山二号A1000自动驾驶芯片的算力达到58-116TOPS,能效比超过6 TOPS/W;由单颗A1000组成的控制器,可以支持L2+级自动驾驶,2颗、4颗并联,则分别可以实现140TOPS、 280TOPS的算力,用来支持L3,甚至是限定场景的简单的L4级自动驾驶系统。我们将公司和特斯拉、英伟达的方案进行对比,两颗黑芝麻A1000组成的L3级自动驾驶控制器算力为140 TOPS,功耗25W,能效比为5.6TOPS/W。特斯拉FSD控制器为2 TOPS/W,英伟达Xavier单芯片则为1 TOPS/W。
A1000功能覆盖多种极端场景。A1000不仅支持毫米波雷达、超声波雷达、摄像头、IMU、GPS等常见传感器,并且还可接入高等级自动驾驶常用的激光雷达、V2X等数据。A1000芯片的AI加速引擎得益于高性能ISP,A1000可以最多接入12路高清摄像头的画面(最高甚至可以达到4K分辨率),再加上高达30Gbps的高带宽,让其可以每秒处理12亿像素。此外,A1000还支持HDR处理,通过将长曝光和短曝光的图像进行拟合,来让汽车在黑暗、逆光等不利环境下也能看得清楚。
多核心冗余,提升自动驾驶安全性能。一方面,在安全性上,在A1000内部,专门部署了一个安全核心,在其他核心失效时使得基础功能能够获得保证。而在实现L3或L4级自动驾驶的过程中,多颗芯片互为冗余,从而满足ASIL-D功能安全等级。另一方面,在经济性上,相对于A1000选择了16nm工艺,并通过设计将SoC封装尺寸成功缩小至90平方毫米。
最新一代高性能车规级自动驾驶计算芯片——A1000 Pro ,其算力达到106-196TOPS,算力水平介于Mobileye与英伟达之间。从功耗上来看,该芯片功耗仅为25w,单颗 A1000Pro芯片可支持高等级自动驾驶功能。
华山二号A1000Pro基于两大自研核心IP——车规级图像处理器NeuralIQ ISP以及DynamAI NN车规级低功耗神经网络加速引擎打造。A1000 Pro在A1000的基础上进行设计优化和提升,采用先进封装工艺集成多个核心,成功解决了在16nm工艺下支持超大规模深度学习引擎的难题,开创了自动驾驶芯片的先河。同时,DynamAI NN大算力架构使得A1000 Pro 支持 INT8 稀疏加速,算力106-196TOPS,继续保持国内最高算力自动驾驶算力芯片的位置。
华山二号A1000 Pro采用异构多核架构。A1000Pro采用16核Arm v8 CPU,16nm工艺制程,支持16路高清摄像头输入,具有高性能、低功耗、安全可靠的特点,能够支持L3/L4高级别自动驾驶功能。华山二号A1000 Pro支持黑芝麻智能最新的FAD Platform。FAD Platform是业界领先的面向分布式计算的自动驾驶中间件,能够适配多种标准协议和操作系统,并提供软件全生命周期的管理。在华山二号A1000Pro系统中,任务可以在多个子系统之间动态迁移,具有易开发、高可用、零拷贝等特性,提升算法的效率与灵活性。
“预埋”强大计算平台,支撑应用不断迭代。目前自动驾驶主要有两类路径,一类是直接针对ODD场景进行L4级别自动驾驶研发,另一类是从L2+开始进行渐进式开发。毫无疑问,传统主机厂更为合适的是第二种路径。在这种路径下,对于车载计算平台的可扩展性提出了更高的要求。公司发布的FAD(Full Autonomous Driving)全自动驾驶计算平台便是基于华山二号芯片打造,满足从L2+到L4、L5自动驾驶多级系统的计算需求的全新产品。
3. 瞄准量产趋势,加速产业落地
把握关键时机,加快量产落地。公司市场破局的难点是车的周期与芯片落地量产的周期都很长,所以芯片设计和进入的时机使得行业先行者优势极为明显。因而,目前公司正与主机厂强强联合,以抱团发展的方式,实现生态共建,加速自动驾驶的技术普及和芯片量产装车。
公司目前的目标市场是L2.5及其以上的自动驾驶。目前,公司已经与中国一汽、博世、蔚来、上汽、比亚迪、东风、中科创达、亚太、保隆、所托瑞安、纽劢科技、联友等自动驾驶产业链伙伴在L2+、L3级ADAS和自动驾驶感知系统解决方案上开展了一系列合作。
黑芝麻智能已经拥有一汽、上汽等强势的朋友圈生态。例如,一汽集团不但参与了黑芝麻智能的融资,也与后者基于L3级自动驾驶展开深入合作。公司与一汽集团达成了从前沿技术研发、基础平台建设到量产项目的深度合作。其中包括:2019年,一汽集团与黑芝麻智能宣布将在自动驾驶芯片、视觉感知算法和数据等领域进行合作;2020年,一汽智能网联开发院与黑芝麻智能宣布将联合开发基于华山二号A1000的智能驾驶平台,一汽南京与黑芝麻智能宣布将共同研发红旗芯算一体化自动驾驶平台,应用于红旗旗舰SUV车型。