YOLOv5全面解析教程②:如何制作训练效果更好的数据集
撰文 | Fengwen, BBuf
本文主要介绍 One-YOLOv5 使用的数据集格式以及如何制作一个可以获得更好训练效果的数据集。本节教程的数据集标准部分翻译了 Ultralytics/YOLOv5 wiki 中对数据集相关的描述(https://github.com/ultralytics/yolov5/wiki/Tips-for-Best-Training-Results) 。
1
数据集结构解读
1. 创建dataset.yaml
# YOLOv5 🚀 by Ultralytics, GPL-3.0 license
# COCO128 dataset https://www.kaggle.com/ultralytics/coco128 (first 128 images from COCO train2017) by Ultralytics
# Example usage: python train.py --data coco128.yaml
# parent
# ├── one-yolov5
# └── datasets
# └── coco128 ← downloads here (7 MB)
# train and val data as 1) directory: path/images/, 2) file: path/images.txt, or 3) list: [path1/images/, path2/images/]
# 训练和验证图像的路径相同
train: ../coco128/images/train2017/
val: ../coco128/images/train2017/
# number of classes
nc: 80 # 类别数
# class names 类名列表
names: ['person', 'bicycle', 'car', 'motorcycle', 'airplane', 'bus', 'train', 'truck', 'boat', 'traffic light',
'fire hydrant', 'stop sign', 'parking meter', 'bench', 'bird', 'cat', 'dog', 'horse', 'sheep', 'cow',
'elephant', 'bear', 'zebra', 'giraffe', 'backpack', 'umbrella', 'handbag', 'tie', 'suitcase', 'frisbee',
'skis', 'snowboard', 'sports ball', 'kite', 'baseball bat', 'baseball glove', 'skateboard', 'surfboard',
'tennis racket', 'bottle', 'wine glass', 'cup', 'fork', 'knife', 'spoon', 'bowl', 'banana', 'apple',
'sandwich', 'orange', 'broccoli', 'carrot', 'hot dog', 'pizza', 'donut', 'cake', 'chair', 'couch',
'potted plant', 'bed', 'dining table', 'toilet', 'tv', 'laptop', 'mouse', 'remote', 'keyboard',
'cell phone', 'microwave', 'oven', 'toaster', 'sink', 'refrigerator', 'book', 'clock', 'vase', 'scissors',
'teddy bear', 'hair drier', 'toothbrush']
# Download script/URL (optional) 用于自动下载的可选下载命令/URL 。
download: https://ultralytics.com/assets/coco128.zip
修改训练和验证图像的路径为自定义数据集路径
修改类别数和类名列表
coco.yaml
的数据集路径配置,这里的训练和验证图像的路径就是直接用txt表示:2. 创建 Labels
*.txt文件规范如下所示:
每一行 一个目标。
每一行是 class x_center y_center width height 格式。
框坐标必须采用标准化xywh格式(从0到1)。如果框以像素为单位,则将x_center和width除以图像宽度,将y_centre和height除以图像高度。
类号为零索引的编号(从0开始计数)。
这里假设以 COCO 数据集的目标类别约定来标注
3. COCO128 数据集目录结构组织
dataset/images/im0.jpg # image
dataset/labels/im0.txt # label
2
制作数据集
1. 数据集标注工具
这里主要介绍 LabelImg 是一种矩形标注工具,常用于目标识别和目标检测,可直接生成 YOLOv5 读取的txt标签格式,但其只能进行矩形框标注(当然也可以选用其它的工具进行标注并且网上都有大量关于标注工具的教程。)
首先labelimg的安装十分简单,直接使用cmd中的pip进行安装,在cmd中输入命令行:
pip install labelimg
labelimg
即可打开运行。
点击Open Dir选择数据集文件夹,再点击Create RectBox进行标注。
当你绘制框结束就会弹出标签选择框,然后标注类别。这个类别编辑更改在Labelimg文件里,里面有classes.txt文档,打开手动更改类别即可(当出现新类别时也可在标签选择框里输入点OK就自动添加类别了)。
标注好后选择 yolo 格式,点击 Save 保存。标注结果保存在图片名.txt文件中,txt文件和图片名称一致,内容如下:
一个好的数据集标准?
每个类的图像。>= 1500 张图片。 每个类的实例。≥ 建议每个类10000个实例(标记对象) 图片形象多样。必须代表已部署的环境。对于现实世界的使用案例,我们推荐来自一天中不同时间、不同季节、不同天气、不同照明、不同角度、不同来源(在线采集、本地采集、不同摄像机)等的图像。 标签一致性。必须标记所有图像中所有类的所有实例。部分标记将不起作用。 标签准确性。 标签必须紧密地包围每个对象。对象与其边界框之间不应存在任何空间。任何对象都不应缺少标签。 标签验证。查看train_batch*.jpg 在 训练开始验证标签是否正确,即参见 mosaic (在 YOLOv5 的训练日志 runs/train/exp* 文件夹里面可以看到)。 背景图像。背景图像是没有添加到数据集以减少 False Positives(FP)的对象的图像。我们建议使用大约0-10%的背景图像来帮助减少FPs(COCO有1000个背景图像供参考,占总数的1%)。背景图像不需要标签。
其中:
Instances per category 表示每个类别的实例数 Categories per image 表示每幅图像的类别 (a) Instances per image 表示每幅图像的实例数 (b) Number of categories vs. number of instances 表示类别数目 vs 实例数目 (我们可以看到 COCO 数据集的类别和实例的数目达到了一个较好的平衡) (c) Instance size 表示实例个数 (d) Number of categories 表示类别数 (e) Percent of image size 表示图像大小百分比
参考文章
https://github.com/ultralytics/yolov5/wiki/Tips-for-Best-Training-Results https://docs.ultralytics.com/tutorials/train-custom-datasets/#weights-biases-logging-new
李白:你的模型权重很不错,可惜被我没收了 单RTX 3090训练YOLOv5s,时间减少11小时 OpenAI掌门Sam Altman:AI下一个发展阶段 对比四大深度学习框架,我发现都关注两大问题 比快更快,开源Stable Diffusion刷新作图速度 OneEmbedding:单卡训练TB级推荐模型不是梦