深度学习目标检测在实际场景中的应用(附源代码)
关注并星标
从此不迷路
公众号ID|ComputerVisionGzq
学习群|扫码在主页获取加入方式
计算机视觉研究院专栏
作者:Edison_G
目标检测是现在最热门的研究课题,目前最流行的还是Yolo系列框架,最近我们计算机视觉研究院也分享了很对目标检测干活及实践,都是Yolo-Base框架,今天我们分享一个经过修改后的Yolov5,实时检测的效果!
开源代码:https://github.com/ultralytics/yolov5/releases
01
前言
目标检测是现在最热门的研究课题,现在的框架越来越多,但是技术的新颖性到了瓶颈,目前开始流行Transformer机制,而且在目标检测领域也能获得较大的提升,也是目前研究的一个热点。
即将举行的亚运会,将会投入更多的先进科技,比如3D成像、姿态估计、目标检测、跟踪及识别!让去全世界看到不一样的中国,不一样的科技,不一样的亚运会。今天我们就说说目标检测会在亚运会中的体现!
目前最流行的还是Yolo系列框架,最近我们“计算机视觉研究院”也分享了很对目标检测干活及实践,都是Yolo-Base框架。
高斯YoloV3目标检测(文中供源码链接) Yolo轻量级网络,超轻算法在各硬件可实现工业级检测效果(附源代码) 不再只有Yolo,现在轻量级检测网络层出不穷(框架解析及部署实践) CVPR21目标检测新框架:不再是YOLO,而是只需要一层特征(干货满满,建议收藏)
02
新框架改进
今天我们分享一个经过简单优化过的Yolov5,暂时命名为:Pad-YoloV5,在IPad上可以实时检测!基于YoloV5框架,熟悉的同学应该都不用多加解释。
YoloV4在YoloV3的基础上增加了近两年的研究成果,如下:
输入端采用mosaic数据增强 Backbone上采用了CSPDarknet53、Mish激活函数、Dropblock等方式。(cspnet减少了计算量的同时可以保证准确率) Mish函数为: Neck中采用了SPP、FPN+PAN的结构, 输出端则采用CIOU_Loss、DIOU_nms操作
YoloV5主要的改变,如下:
输入端:Mosaic数据增强、自适应锚框计算
Backbone:Focus结构,CSP结构
Neck:FPN+PAN结构
Prediction:GIOU_Loss
这次主要优化,是YoloV5在数据增强的时候,用随机缩放、随机裁剪、随机排布的方式进行拼接,这个对于小目标的检测效果还是很友好的。通过实验发现,这个随机拼接和有规律的拼接,最终的结果还是有一点差别的。
首先我通过修改数据增强的策略,开始对整体数据集进行统计(也就是数据预处理分析),我大致分成三个范围。将最大的与最小的进行随机拼接,最终结果确实比整体随机的效果好!
© THE END
转载请联系本公众号获得授权
计算机视觉研究院学习群等你加入!
扫码关注
计算机视觉研究院
公众号ID|ComputerVisionGzq
学习群|扫码在主页获取加入方式
往期推荐
🔗