VOC使用xml來描述標註,而YOLO使用txt格式文件,導致VOC格式數據集無法直接拿來訓練YOLO,這就需要轉換格式。爲了不重複造輪子,我們使用convert2Yolo來進行轉換。
>>> python3 example.py --datasets VOC --img_path ~/Downloads/VOC2028/JPEGImages/ --label ~/Downloads/VOC2028/Annotations/ --convert_output_path ~/Downloads/VOC2028/yolo/ --img_type ".jpg" --manipast_path ./ --cls_list_file ~/Downloads/VOC2028/ImageSets/voc.names
轉換完成後發現,生成的標註文件名與圖像文件名不一致,經過排查發現改一處代碼就能修復
這裏改爲
>>> data[root.find("filename").text.split(".")[0]] = annotation
可以直接克隆我改過的代碼:https://github.com/MacwinWin/convert2Yolo/tree/fixed