pascal voc2012数据集介绍

原創

2018-08-25 16:25

本文主要介绍pascal voc2012原始数据集和增强数据集

原始pascal voc2012 数据集和增强pascal voc2012 数据集的下载地址，我在上一篇讲语义分割的文章中写到了，大家可以去找一下。

一、原始pascal voc2012 数据集

该数据集包括20个对象类：

10个动作类：

running,jumping，phoning,playing music instrument,reading,riding,riding a horse,taking a photo,using a computer,walking

下载完解压后可以看到VOCdevkit，其中包括以下几个部分：

具体内容：

Annotations:17125个对象, .xml格式的标签

ImageSets:包括action layout main segmentation四个部分的内容，是数据集中每一种类型图片的信息。

其中Action下存放的是人的动作（例如running、jumping，phoning,playing music instrument,等等，这也是VOC challenge的一部分）

Layout下存放的是具有人体部位的数据（人的head、hand、feet等等，这也是VOC challenge的一部分）

Main下存放的是图像物体识别的数据，总共分为20类。

Segmentation下存放的是可用于分割的数据。

JPEGImages: 17125张jpg图片,包括训练图片和测试图片。

SegmentationClass: 分类结果，2913张png图片

SegmentationObject: 也是物体分割后的结果，总共2913张png图片。

注意2个分割后图片标签的区别：
* SegmentationClass: 标注出每一个像素的类别；
* SegmentationObject:: 标注出每一个像素属于哪一个物体。

二、增强pascal voc2012 数据集

解压之后是benchmark_RELEASE，benchmark_code_RELEASE没有什么可讲的，主要说一下dataset。

cls: 11335个.mat格式的标签；

img：11335张jpg图片；

inst: 也是11335个.mat格式的标签。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.