查看原文
其他

元戎启行HVNet模型荣获全球计算机视觉领域“奥斯卡”CVPR收录 | 同行者

复星锐正 2021-04-08

The following article is from 新智驾 Author 报道汽车未来的



近日,复星锐正被投企业元戎启行的一篇关于3D物体检测的论文被CVPR2020收录,论文题为“HVNet: Hybrid Voxel Network for LiDAR Based 3D Object Detection”,介绍了元戎启行的深度学习网络模型HVNet。与多种方法相比,HVNet在3D物体检测速度和精度上都有显著的提高。

CVPR(Conference on Computer Vision and Pattern Recognition,即 IEEE 国际计算机视觉与模式识别会议)被誉为全球计算机视觉领域的“奥斯卡”。在中国计算机学会推荐国际学术会议的排名中,CVPR为人工智能领域的A类会议。CVPR有着非常严苛的录用标准,会议整体的录取率通常不超过30%,而口头报告的论文比例更是不高于5%。

今年,CVPR更是创下十年来最低接收率,在6656篇投稿中只有1470篇论文被接收,接受率仅有22%。而元戎启行作为国内领先的L4级自动驾驶解决方案提供商,凭借其在自动驾驶领域的领先技术,在本次会议中崭露头角。


深度学习网络模型HVNet,自动驾驶领域的奠基石


自动驾驶是人工智能的一个关键应用领域。而深度学习是实现人工智能的一项主流技术。深度学习包含训练推理两大过程,两者都围绕着深度学习的基本要素——深度学习网络模型(以下简称模型)展开。训练指的是对模型进行训练,为模型(的不同节点)进行分配加权,推理则指的是利用训练好的模型对全新的数据进行推理判断、得到正确答案的过程。答案的准确度,与模型和推理直接相关。
深度学习示意图
而在自动驾驶领域,深度学习则被用于感知车辆周围物体,从而为车辆决策和控制提供判断数据。与此同时,3D物体检测则是当前感知模块至关重要的一个环节。而为了保证自动驾驶的安全,3D物体检测最重要的工作,就是平衡好精度以及耗时,让系统能迅速识别,实时响应。
3D物体检测
针对3D物体检测,元戎启行提出了一种新的基于点云的3D物体检测统一网络模型:混合体素(体积像素,是数字数据于三维空间分割上的最小单位)网络——HVNet,通过在点级别上混合尺度体素特征编码器(VFE),得到更好的体素特征编码方法,实现了3D物体检测速度和精度上的提升。
KITTI测试集上的速度-精度对比图,其中O为HVNet
元戎启行在KITTI数据集上进行了实验验证。KITTI数据集是目前国际上最大的适用于自动驾驶的计算机视觉算法评测数据集之一,涵盖城市、住宅区、道路、校园、行人等五大场景,是检验L4级自动驾驶感知算法的最重要的评估方式之一。
在KITTI数据集的实验中,HVNet取得了自行车类检测困难和中等模式的第一名,汽车类检测中等模式的第六名,排名超过Apple、UberATG等企业。
元戎启行感知技术总监曹通易表示:“在多类别物体检测中,很多方法通过训练多个模型来检测不同的类别,我们仅通过单一的网络完成输出。在KITTI的多类别检测任务中,我们取得了当时最好的mAP(平均准确率),同时保证了实时的效率。相比于PointPillars、Second等算法,HVNet在效率也有很大的突破。”


推理引擎DeepRoute-Engine,实现自动驾驶算法的高效运转


有了高性能的模型,自动驾驶的感知只成功了一半,只有完成了高效、准确的推理,自动驾驶系统才能准确判断周围物体。为了更好地匹配HVNet,元戎启行还研发了推理引擎DeepRoute-Engine,针对HVNet的自定义算子和网络结构,做出更好的计算资源上的优化,让自动驾驶算法能够在低成本、低功耗的硬件平台上高效、稳定地运行
相比主流的深度学习框架中的推理引擎,DeepRoute-Engine不论是对简单的卷积为主的图像模型还是对多传感器融合的模型,都有出色的优化效果。对复杂的多传感器模型反而有更高的推理速度。
DeepRoute-Engine和主流计算框架推理速度对比
而在兼容性方面,DeepRoute可支持英伟达、英特尔、AMD等品牌的计算平台。DeepRoute-Engine还能很好地适配PyTorch、Caffe、TensorFlow等深度学习框架,不同的框架训练出的模型,都可使用DeepRoute-Engine进行推理。
除此之外,DeepRoute-Engine还支持实时数据类型转换推理,在部署一套模型时,可在运行时调整精度,减少内存空间占用,提高部署效率。DeepRoute-Engine支持自定义层融合和用户插件,有较高的可扩展性。


计算平台解决方案DeepRoute-Tite,助推自动驾驶商业化落地


由于自动驾驶的实现,不仅需要过硬的AI技术,更要控制好成本和功耗,才能真正实现产业化落地。
目前行业内对推理速度的最低要求是10fps。但对于低功耗计算平台产品来说,这是一个很大的挑战。以PyTorch等主流框架为例,当它们在低功耗的计算平台产品上,用复杂的模型进行推理时,计算速度一般低于10fps,无法满足这一要求。
专注于L4级自动驾驶全栈技术的元戎启行,则借助自研的高效推理引擎,很好地解决了这一问题。
2020年1月CES期间,元戎启行发布了其新一代计算平台解决方案——DeepRoute-Tite。该平台只有砖头大小,以45W的功耗运行了自动驾驶所有相关算法。得益于元戎启行自研的高效推理引擎,算法移植到这一平台后,系统仍能实时、精确地识别周围障碍物,实时响应,以接近城市道路最高限速的速度行驶,灵活完成红绿灯识别、转弯,避障等操作。
元戎启行使用低功耗计算平台进行自动驾驶路测视频
目前,整个自动驾驶行业都在往小型化、嵌入式方案发展。除了传感器的小型化,更关键的是替换车辆后备箱内原本体积庞大的高功耗计算平台。  元戎启行新一代计算平台DeepRoute-Tite
高效、准确的自研模型、自研推理引擎、低功耗低成本计算平台的组合,使得元戎启行的自动驾驶解决方案,平衡了安全性、效率、成本这三个自动驾驶的量产制约因素,既保障了技术的安全,又归还了汽车后备箱空间,让自动驾驶能够更快地大规模进入人们的生活。
2020年6月16-18日,复星锐正被投企业元戎启行也将亮相于在美国西雅图举办的CVPR,与全球学者共同探讨CV议题,推动中国自动驾驶技术的进一步发展。

往期阅读:复星锐正印度团队荣获全球采购先进团队荣誉称号 | 锐·荣誉
「月」读 | 专注,在自己擅长的赛道狂奔,用成绩印证未来
猩猩向荣,保持乐观,超级猩猩终于回来了!| 同行者自动驾驶应用场景拓宽,元戎启行加速商业落地 | 同行者
新经纪时代,存量房市场深水区的一场数字化较量 | 反观投资
保险极客获2500万美金C轮融资 | 锐·Family
复星锐正获2019年度创业投资机构50强 | 锐·荣誉
颜值经济井喷,如何撬动万亿级“她经济”美妆市场 | 反观投资

 觉得好看,请点击“在看”分享!

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存