开源目标检测算法用于交通标志检测全方位评估
(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)
交通标志检测在自动驾驶、汽车主动安全中应用非常重要,通用的目标检测算法可以通过微调网络的方式直接用于交通标志检测。如何在不同的硬件平台和应用环境中选择算法?今天介绍的刚刚被《Neurocomputing 》接收的论文《Evaluation of deep neural networks for traffic sign detection systems》做了一个较为详尽的评估比较。
来自西班牙Universidad de Sevilla 的学者全方位评估了现有主流的目标检测算法用于交通标志检测,对于进行相关研究和开发的人员具有重要的参考价值。
作者信息:
作者评估了目前目标检测的state-of-the-art算法,包括Faster R-CNN、R-FCN、SSD、YOLO V2,并把它们与各种提取网络结合,包括Resnet V1 50、Resnet V1 101、Inception V2、Inception Resnet V2、Mobilenet V1、Darknet-19。
下图列出了所有评估组合:
使用上述开源目标检测模型在Microsoft COCO数据集上的预训练权重,然后在交通标志数据库German Traffic Sign Detection Benchmark dataset(GTSDB)训练集上微调网络,然后在该数据集测试集上评估。
评估指标包括:mAP、FPS、内存占用、FLOPS、参数量。
GTSDB库示例
GTSDB含有900幅图像,共计1206个交通标志,其中600幅训练图像含有846个交通标志,300幅测试图像含有360个交通标志。交通标志类别分为mandatory, prohibitory, danger, 和 other四类,本次评估仅考虑前三类。
硬件平台
CPU Intel Core i7-4770, 内存16GB,GPU是拥有3840CUDA核心与12GB显存的NVIDIA Titan Xp。
评估结果
检测精度结果
按照mAP排序的结果
精度与运行时间散点图
各个模型在小、中、大目标上的检测结果对比
内存占用与运行时间散点图
检测结果示例
结论
Faster R-CNN与Inception Resnet V2的组合达到最高的mAP(95.77%),R-FCN与Resnet 101组合达到精度(95.15%)和速度(85.45ms每幅图像)的最佳平衡,YOLO V2取得了有竞争力的精度(78.83%)并且是第二快的(21.48ms每幅图像),SSD MobileNet则是最快的模型(15.14ms每幅图像),也是对内存要求最低的(94.70MB)。
SSD MobileNet最适合在移动端和嵌入式设备部署,但对小的交通标识检测结果不好。
文中所用的代码与模型下载地址请查看原论文。
论文地址:
https://www.sciencedirect.com/science/article/pii/S092523121830924X
论文下载:
在“我爱计算机视觉”公众号对话界面回复sign,即可收到论文的百度云下载地址。
(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)