本文主要介绍pascal voc2012原始数据集和增强数据集
原始pascal voc2012 数据集和增强pascal voc2012 数据集的下载地址,我在上一篇讲语义分割的文章中写到了,大家可以去找一下。
一、原始pascal voc2012 数据集
该数据集包括20个对象类:
- person;
- bird; cat;cow;dog;horse;sheep;
- aerphone;bicycle;boat;bus;car;matorbike;train;
- bottle;chair;dining table;potted plant;sofa;monitor,
下载完解压后可以看到VOCdevkit,其中包括以下几个部分:
具体内容:
Annotations:17125个对象, .xml格式的标签
ImageSets:包括action layout main segmentation四个部分的内容,是数据集中每一种类型图片的信息。
其中Action下存放的是人的动作(例如running、jumping,phoning,playing music instrument,等等,这也是VOC challenge的一部分)
JPEGImages: 17125张jpg图片,包括训练图片和测试图片。
SegmentationClass: 分类结果,2913张png图片
SegmentationObject: 也是物体分割后的结果,总共2913张png图片。
注意2个分割后图片标签的区别 :
* SegmentationClass: 标注出每一个像素的类别 ;
* SegmentationObject:: 标注出每一个像素属于哪一个物体。
二、增强pascal voc2012 数据集
解压之后是benchmark_RELEASE,benchmark_code_RELEASE没有什么可讲的,主要说一下dataset。
cls: 11335个.mat格式的标签;
img:11335张jpg图片;
inst: 也是11335个.mat格式的标签。