锅炉知识
机动车检测数据集预处理
2023-02-28  浏览:1

KITTI 数据集为摄像机视野内运动物体提供一个 3D 边框标注(使用激光雷达坐标系)。数据集标注存于每种任务子数据集的 label 文件夹内,以 Object detection 任务数据集为例,标注文件各个字段含义如下表所示:

其中,’Dont Care’标签表示该区域没有没标注,如由于目标物体距离激光雷达过远,为防止在评估过程中将本来是目标物体但因某些原因没有标注的区域统计为伪积极性,评估脚本会自动忽略’Dont Care’区域的预测结果。

在使用 KITTI 数据集作为 YOLOv5 车辆检测训练数据集之前,需将 KITTI 数据集格式转换为 PASCAL VOC 数据集格式再转换为 YOLO 数据集格式。第一步对 KITTI 数据集进行类别归纳与数据清洗,将同种类别的标签归纳为同一类别标签:将 truck、van、tram 标签合并为汽车类 Car 标签;将 Pedestrain_sitting 标签合并为行人类 Pedestrain 标签;忽略 Dont Care 类和 Misc 类标签。

第二步将 KITTI 格式的 txt 标注文件转换为 PASCAL VOC 格式的 xml 标注文件。其中仅保留 KITTI 数据集中目标 bounding box 坐标参数与目标类型以及图片像素大小与通道数。UA-DETRAC 数据集预处理方式与 KITTI 数据集预处理方式相同,第一步先将UA-DETRAC 数据集标注文件转换为 PASCAL VOC 格式的 xml 标注文件,第二步将图片重命名后进行合并。之后,将处理好的 KITTI 数据集中图片与 xml 标注文件分别和UA-DETRAC 数据集中图片和 xml 标注文件合并至同一文件夹内,将 PASCAL VOC 格式的 xml 标注文件转换成 YOLO 格式标注文件,对应标注文件个数与图片个数相同。

YOLO 格式标注文件将图片中目标物体的中心点坐标与目标框宽高都进行了归一化处理,标注内容包括五要素:class_id、x、y、w、h,注释如下表所示,转换格式后的KITTI 数据集共有图片 7481 张,对应标注文件 7481 个。还需注意的是 KITTI 数据集中标注图片格式为 png,需格式转换为 jpg 图片才可由 YOLOv5 检测算法进行训练,数据集预处理完成后,下一步进行检测训练。

将预处理后的 KITTI、UA-DETRAC 数据集做为机动车检测训练数据集,共 89566张图片,按8: 2的比例将图片和标注文件随机划分至训练集与测试集,其中训练集图片70635 张,测试集图片 18931 张,

大豆出苗评估