毫末 AI DAY 干货合集:城市 NOH 发布、MANA 数据智能最新进展
从去年开始,毫末智行每个季度都会召开一场品牌日,来对外分享毫末在技术领域取得的进展。但是从第四季度开始,毫末智行正式将品牌日更名为 AI DAY,并且这个名字将会沿用下去。
要知道,在全球范围内,以 AI DAY 为名召开分享会的除了毫末以外,也只有大洋彼岸的特斯拉。所以毫末有什么真技术,我们直接看发布会内容。
按照惯例,发布会伊始总要回顾一下取得的成绩以及对未来进行展望。
自 2021 年 5 月搭载毫末智行 HWA 高速智能驾驶系统的首款车型魏牌摩卡上市后,毫末的智能驾驶产品陆续上车坦克 300 城市版、哈弗神兽等 5 款车型上。
去年 11 月,毫末智行正式推出高速 NOH,而搭载了毫末 NOH 系统的魏牌摩卡,成为了世界首款具备领航智能驾驶功能的燃油车型。
截止今年 4 月,搭载毫末智行高速智能驾驶系统的用户行驶总里程已突破 700 万公里。毫末智行的长期目标是,在未来三年内前装 100 万台车。
01三大战役
数据智能技术之战
在今天的 AI DAY 上,毫末智行董事长张凯称:2022 年,毫末智行要进行三场重大战役,分别是数据智能的技术之战、智能驾驶的场景之战以及末端物流自动配送车的规模之战。
数据方面,毫末智行于去年底 AI DAY 上正式发布了 MANA 数据智能体系。MANA 是毫末以海量数据为基础的一整套数据处理工具,包含了算法模型、测试验证系统、仿真模拟工具以及计算硬件。简单来说,MANA 这套系统可以将数据转化为知识,最终来优化产品的表现。
在这里,我们也不妨简单回顾一下去年 AI DAY 上关于 MANA 智能数据体系的介绍。
MANA 的由来
想要做好自动驾驶,必须要积累大量的数据。对于毫末来说,数据并不是问题,问题是如何好好地利用这些数据。
MANA 由四大块组成,分别是 BASE 底层系统、TARS 数据数据原型系统、LUCAS 数据泛化系统和 VENUS 数据可视化平台。
BASE 底层系统指的是对数据进行存储、传输、计算以及数据分析和数据服务;TARS 则是关于计算的核心算法原型,包括感知、认知、车端建图和验;LUCAS 是对算法在应用场景上的实践,包括高性能计算、诊断、验证和转化为核心能力;VENUS 可视化平台是指对场景的还原以及数据洞察能力。
这类专业名词确实晦涩难懂,需要理解成本。用毫末智行顾维灏的话总结就是:数据智能的「思想钢印」,就是用更低的成本、更快的速度去迭代产品,提供安全、好用的产品给客户。
而如今时隔三个月,MANA 的感知能力获得了大幅提升。得益于芯片算力几何式增长,Transformer 跨模态模型的出现和 Camera 像素的快速提升,硬件技术的提升驱动软件能力的提升。
一切技术的研发,都是为了解决行车中遇到的场景问题。
感知的进化
城市道路中,最常见的场景就是红绿灯路口,其中红绿灯难点主要在于检测目标小、状态会变化(闪烁等)、不同地域红绿灯形状有所不同,当然最复杂的还是「绑路」问题,不同的灯要对应不同的车道,即便是人类司机有时遇到特殊情况也会有所迟疑,更别说机器。
所以针对这一场景,毫末采用的是用大量的数据去训练,通过图像合成和迁移学习,来加快技术的更新。
为了扩大样本量,毫末智行用大量的仿真环境模拟来弥补真实场景样本量不足的问题。
仿真合成图像存在以下两个问题,一是特征不真实,例如露天的红绿灯常年经受大雨和暴晒,出现破损和灰尘是很常见的。即便合成图像完全模拟了真实情况,那么分布概率也有存在不匹配的情况。因此毫末研发人员只能最大限度地使用合成数据,以减少合成数据和真实数据之间的误差。
混合迁移学习,指的就是毫末会利用合成数据定向弥补真实数据的缺失,另外还要不断调整训练策略来减小两种不同数据间的概率分布差异。
在获得了足够多的数据基础上,毫末智行开始尝试对真实世界中的红绿灯进行识别测试。
毫末为此设计了独创「双流」感知模型,将红绿灯检测和绑路问题分解成两个通道。通俗地讲,这个模型有两路通道,一路是检测物体(是什么,即 what),一路理解空间、位置关系(即 where)。
「what」通路主要负责红绿灯的识别信息,主要包含对红绿灯灯箱的检测和灯型的分类,分别输出红绿灯的颜色、形状和朝向信息。「where」通路主要负责红绿灯绑路,即输出目标车道的红绿灯灯组。
目前绝大多数辅助驾驶都是通过车道线循迹实现的。毫末采用的是 BEV Transformer 来识别车道线,遍布车身的摄像头在得到车身周围的图像数据后,首先对 2D 图像用 Resnet + FPN 进行处理,之后进行 BEV Mapping,即鸟瞰视觉的映射,这部分会利用 Cross Attenion 来动态确定某一帧图像的内容在相机所属鸟瞰视觉空间中的位置。通过多个 Cross Attention,最终组成一个完整的 BEV空间。
但是这时感知信息是没有「上下文联想」能力的,还需要在此基础上加入历史鸟瞰视觉这类与时间有关的特征,让系统具备前后关联的能力,进一步提升感知准确率。
MANA 的认知进化
在介绍认知的进化之前,我先通俗地解释一下何为「认知」。
感知很好理解,车辆看到了什么就是感知到了什么,这依赖于硬件的素质。而「认知」则依赖于工程师的代码。
认知不是「客观事实」,而是「约定俗成」。
在这里顾维灏用一个场景解释了认知进化的重要性。
当我们想要左转过路口时,我们既需要等待掉头的前车,也要观察对向来车。过去处理这样的场景,工程师需要写大量的规则式场景判定和参数设定,代码非常臃肿。
但是毫末如今通过对类似场景更多的数据研究,用机器学习模型来替代了手写规则和参数,并且还有更广泛的实用性。
认知问题上还存在驾驶策略的一致性和可解释性问题。
毫末选择和阿里合作,将本来应用于自然语言处理、文本自动生成和文本分类、图像分类的阿里 M6 大模型率先带到了自动驾驶领域。
场景落地之战
自动驾驶,竞争的产品、是场景落地。
毫末智行董事长张凯称,毫末智行已完成了城市 NOH 全部的功能开发。在城市环境中能够实现自动变道超车、红绿灯识别与控车、复杂路口通行、无保护左右转等主要功能。根据最近释放的测试视频来看,毫末城市 NOH 在车流量并不算小的路段中,完成了全程无接管驾驶,展现了不俗的实力。
毫末称目前城市 NOH 系统已经在北京、保定等城市进行深度场景打磨。搭载毫末城市 NOH 系统的车辆也会在近期正式量产落地。
另外,毫末智行还对外公布了一项极其开放的合作模式—— 6P 开放合作模式。
自动驾驶是一项极其复杂的系统性工程,需要不同领域、不同行业多元学科的融合。如今大多数玩家都选择「抱团取暖」、「合作共创」的合作模式。
而毫末作为一家科技公司,既可以作为供应商,为其他没有自研能力的公司提供解决方案,又能够与其他公司共同开发。合作方可以选择采用毫末的全栈技术解决方案,可以选择在数据智能云端服务层面与毫末合作,也可以选择在软件和硬件层面与毫末合作。
这样的玩法与地平线很相似,二者都是既做硬件,又有软件研发能力的公司。
末端物流配送之战
在末端物流自动配送方面,毫末智行在本年度全面升级了末端物流自动配送车的生产基地,升级后的生产车间占地 1 万平米,可实现年产 1 万台的无人配送车的产能目标。
在今天的 AI DAY 上,毫末智行正式发布了第二代末端物流自动配送车——小魔驼 2.0,最终定价为 12.88 万元。
小魔驼 2.0 搭载了 ICU 3.0 大算力计算平台,可定制 600 升载货空间货箱,另外还支持智能语音、触摸等交互方式。
城市 NOH
去年底 AI DAY 上,毫末智行对外展示了城市 NOH 的 demo 视频,但仅仅三个月后,这一功能就来到了量产的门前。
硬件层面,HPilot 3.0 系统配备了高通 8540 + 9000 芯片,算力为 360 TOPS,同时还配备了两颗激光雷达、12 颗摄像头和 5 颗毫米波雷达。
毫末给自己立的 flag 是:未来三年搭载数超过 100 台,落地超 100 个城市,全面覆盖国内一二线城市。
根据毫末的规划,毫末城市 NOH 将会在 6 月份正式量产上车。无独有偶,小鹏也在不久前的财报电话会议上表示,在获得监管之后,将于二季度末正式推送城市 NGP。我们也可以借此机会看一下,到底是新势力小鹏最先量产城市导航辅助驾驶,还是专注于智能驾驶赛道的科技公司毫末智行更快。
02毫末的 To do List
毫末的 2022 目标非常明确,同时也充满挑战。
毫末计划在 2022 年完成交付 34 款车型、78 个项目。这不仅考验毫末的研发还能,还非常考验组织架构的调动和人才的招聘。
另外毫末还将会开放合作,将自己打造为「合格的」Tier-1。以目前和长城的合作来看,二者的合作绝对是互相成就的事情。毫末能够提供给长城最具竞争力的辅助驾驶能力,而大量的前装上车又能够促进 MANA 的发展。
对于毫末来说,率先量产城市 NOH 似乎只是从 0 到 1。而在这之后,广交好友、扩大朋友圈、继续深入研发、建设人才体系......
在 2022 开了个好头的毫末,仍然有很多仗要打。
撰文:波波
编辑:六三