普通民众对汽车自动驾驶的最初印象始于特斯拉,随后国内新势力汽车企业小鹏,蔚来,理想不断对消费者进行自动驾驶的市场教育。
随着技术不断发展,不同企业相继涌入自动驾驶赛道,有传统车企转型的企业,有新势力主机厂,也有新成立的新型科技公司。
这其中,一个后起之秀闯入了大众视野,那就是毫末智行。业内人士频繁在各个场合听到这个名字。刚刚结束的成都车展上,毫末更是凭借国内首个量产城市NOH的自动驾驶公司一炮而红,成为业内人士热议的对象。
9月13日,毫末迎来了第六届AI DAY。借此契机,我们就来系统性梳理一下毫末的自动驾驶到底什么水平。
注:高阶辅助驾驶与自动驾驶是逐级递进关系,为了方便,本文统一表述为自动驾驶。
2019年至今,毫末已经成立了两年多的时间,官方给出的准确数据是1020天。在这一千多天里,毫末取得了非常迅猛的发展。
官方列出了一些资料,比如“国家高新技术企业”资质、MIT麻省理工科技“50家聪明公司”的称号,以及人工智能最具价值创业公司TOP20等。抛开这些“虚名”,就实际数据看,毫末的成绩如下:
数据方面。毫末的辅助驾驶产品产生的辅助驾驶里程已经接近1700万公里;
2021年12月,毫末推出国内首个智能驾驶数据智能体系MANA。其学习时长已经超过了31万小时,虚拟驾龄达到4万年;
毫末已经完成数十万全要素、多模态CLIPS的标注;
在场景库积累方面,毫末已经建设完成300万小时中国道路驾驶认知场景的场景库;
技术工程化方面,毫末的智能驾驶系统已经迭代了3个版本,并落地了10余款不同平台车型;根据毫末的说法,它可以做到全新车型复用开发 4个月时间达到量产落地状态,可以做到全新车型匹配标定2个月内完成标定;
量产落地层面,基于多款不同平台车型落地经验,毫末智行已经形成一整套高效的智能驾驶产品开发流程,可以做到超过30个智能驾驶项目的异步并行开发。
根据毫末的说法,这些优势积累将帮助毫末在智能汽车时代,快速迭代自动驾驶,导入产品,以形成规模效应建立壁垒。
以过去十年为单位,毫末将自动驾驶分为3个阶段,分别是硬件驱动,软件驱动和数据驱动。硬件驱动阶段的一个显著特点就是“多和强”。传感器越多越好,性能越强越好,但受限于早期成本和技术原因,很难做到大规模普及。软件驱动阶段,更大算力的中央计算芯片出现,它能够支撑更多的传感器。然而在感知方面,各个传感器各自为战,用一些小模型和少量数据做训练,得到单个传感器的识别结果,最后进行感知结果级的融合;并且在认知方向,依然是人工规则为主。这一阶段的成本在降低,效率在提升,但基于人工规则的运行逻辑,依然无法解决自动驾驶的长尾问题。为了提升效率,自动驾驶进入数据驱动时代。其核心在于,化被动为主动,通过数据进行自动驾驶的自我训练与迭代。该时代下,感知层面的多个不同模态传感器的原始数据联合输出感知结果,再通过大量人驾数据抽取可解释的场景化驾驶常识,在配以AI的实时计算,可以更加拟人化的融入社会交通流中;训练方式也从小模型少数据变成海量大数据。数据驱动时代,自动驾驶公司要做的事情本质上都是围绕数据展开。毫末介绍,其成立之初,就一直围绕自动驾驶3.0时代做整体的结构设计与战略布局。根据毫末的说法,其此前所有的积累都是为了自动驾驶3.0时代的数据驱动阶段做准备。数据是开启这个时代的大前提,而高阶辅助驾驶又是搜集海量数据最高效的方式。根据毫末智行张凯的说法,“毫末智行一直都在坚定地走渐进式发展路线。在自动驾驶3.0时代,辅助驾驶是通向自动驾驶的必由之路。”他认为,目前中国已成为全球智能汽车主战场,预计到2025年,高级别辅助驾驶搭载率超过70%。而渐进式路线是数据积累的最佳路径。这个重任顺其自然的要落到城市领航辅助上去。要完成海量数据积累就必须要保证城市NOH的流畅运行。毫末智行CEO顾维灏介绍,城市道路主要存在“4类场景难题、6大技术挑战”。前者包括“城市道路养护频繁”“大型车辆密集”“变道空间狭窄”“城市环境多样”。对应的解决方案面临六大挑战:如何在自动驾驶领域应用大模型,如何让数据发挥更大的价值,如何使用重感知技术解决现实空间理解问题,如何使用人类世界的交互接口,如何让仿真更真,如何让自动驾驶系统运动起来更像人。自动驾驶3.0时代核心就是大数据,需要对海量的数据进行处理。此前,业内在进行模型验证时的常规思路是,对模型不断输入标注数据,并且对其进行监督学习。但在数据标注上,自动标注出错率高,人工标注成本高,导致该方法效率低,成本高。毫末的思路是通过MANA系统将无标注数据来完成自监督学习从而完成模型训练。具体的技术思路是,将所有的感知任务backbone都统一,然后利用无标注数据先训练好这个统一backbone并锁定,模型剩余部分再用标注样本来训练。毫末以BEV结构下的3D空间重建一致性为目标来进行Backbone的预训练。和一般的mask重建图片或者视频的训练目标相比,该方法能够更有效迫使模型理解道路场景的三维结构,从而更好的适应自动驾驶的各种感知任务需求。毫末表示,通过其试验得出的数据,这种方式相比只用标注样本做训练,训练效率可提升3倍以上,并且精度也有所提升。数据多,处理效率就成了问题。比如模型对新场景的敏感度问题,经常会发生遗忘。比如,一年前走过了的路再路过的时候可能忘记了。解决这个问题最普通最直观的做法就是用全量数据再次精细的训练模型,可以理解为做过的题再刷一遍,但是这种做法的成本太高,效率太低。毫末的做法是,构造了一个增量式的学习训练平台。在训练过程中,系统并不会使用全量存量数据,而是抽取部分存量数据加上新数据组合成一个混合数据集。训练时要求新模型和旧模型的输出保持尽量一致,对新数据的拟合尽量好。众所周知,高精地图更新慢、成本高的问题短期内难以克服,这也引得国内自动驾驶公司都在探索“重感知、轻地图”的技术路线。如果达到这样的目的不同的公司有不同的办法。毫末的思路是通过使用时序的transformer模型在BEV空间上做了虚拟实时建图,使得感知车道线的输出更加准确和稳定,让城市导航自动驾驶告别高精地图依赖。自动驾驶里,一个很重要的工作就是对交通参与者的行为预测,以便于自车进行接下来的动作规划。过去这些工作都是通过传感器感知和算法来完成。但是当交通参与者足够多的时候,传感器的负荷会加大,效率会降低,准确率会下降。毫末的思路是加入对其他车辆刹车灯和转向灯的识别从而提升预测效率与准确度。自动驾驶数据没有办法穷尽所有长尾问题,仿真是自动驾驶的必要工作,主要包括:基础仿真能力,仿真环境和运动的基础能力,主要看精准性;构建场景的能力,主要看效率;定义场景的能力,主要看有效性。针对第三点的城市路口,毫末和阿里以及德清政府合作,利用路端设备将路口处每时每刻的真实交通流都记录下来,再导入到仿真引擎里,加上驾驶员模型之后,就可以用于路口场景的调试验证。毫末联合浙江德清、阿里云发布“中国首个基于车路协同云服务的大规模自动驾驶场景库”,这是中国第一个使用真实交通数据生成、满足数据合规要求的自动驾驶场景库。但也有业内人士表示,该方法受场景限制,数据搜集效率和质量都有待观察,看看后续效果如何。毫末的思路是搜集足够多的人类驾驶数据,然后构建自动驾驶场景库,并基于典型场景挖掘海量司机的实际驾驶行为,构建taskpromt,训练一个基于时空Attention的驾驶决策预训练大模型,使得自动驾驶决策更像人类实际驾驶行为。根据毫末的说法,自动驾驶3.0时代最核心的点就是大数据。自动驾驶公司所有的工作都是围绕数据展开,这其中牵扯到几个非常关键的问题,数据的存储和处理以及技术应用。在数据存储上,大数据,大模型需要大算力,比如训练一个千亿参数、百万个clips的大模型,需要上千个GPU训练几个月时间。毫末的思路是超算中心,目标是满足千亿参数大模型,同时数据规模100万clips,整体训练成本可以降低200倍。超算中心也是业内的共识,前不久,小鹏汽车联手阿里云在内蒙古乌兰察布共同成立了自动驾驶超算中心。如果不出意外,有能力的企业基本都会自建数据处理中心。在数据管理上,毫末建立了MANA数据管理系统,闭环式数据管理工作,也是毫末一直以来重点传播的技术。建立自己的数据管理系统也是自动驾驶公司的必经之路,Momenta将这个东西称之为数据飞轮,其实是一个逻辑。在处理数据的多样性上,毫末采取的是Attention机制的transformer结构,顾维灏介绍其在2019年就开始将transformer技术用户自动驾驶的数据处理。目前也是业内在数据处理上的主流思路,包括特斯拉在内的头部企业都在使用该技术。客观地说,不管是已经取得的成绩还是对行业的探索,毫末智行的自动驾驶在国内都处于第一梯队。但是,更严谨一点,必须要加上“现阶段”的时间限制。
《圆周智行》在此前的文章中也有过重点分析,当下自动驾驶正处于量产上车和市场验证阶段,毫末背靠长城汽车取得了一定的先发优势在情理之中,但在市场从1到N阶段,跳出限制,取得更大的突破,才是真正考验企业水平的地方。目前看来,Monenta、华为都给了毫末不小的压力。接下来毫末发展如何,让我们拭目以待。
更多相关精彩内容推荐
加群提示
十大社群交流平台:GIS技术交流、地质生态交流、遥感技术交流、空间规划编制、新型智慧城市、无人机航测建模、地理信息大数据、测绘软硬件产品、高精度地图自动驾驶、乡村振兴交流。入群请加多向选择崔老师微信handsystem
更多精彩资讯扫码关注