本文主要介紹pascal voc2012原始數據集和增強數據集
原始pascal voc2012 數據集和增強pascal voc2012 數據集的下載地址,我在上一篇講語義分割的文章中寫到了,大家可以去找一下。
一、原始pascal voc2012 數據集
該數據集包括20個對象類:
- person;
- bird; cat;cow;dog;horse;sheep;
- aerphone;bicycle;boat;bus;car;matorbike;train;
- bottle;chair;dining table;potted plant;sofa;monitor,
下載完解壓後可以看到VOCdevkit,其中包括以下幾個部分:
具體內容:
Annotations:17125個對象, .xml格式的標籤
ImageSets:包括action layout main segmentation四個部分的內容,是數據集中每一種類型圖片的信息。
其中Action下存放的是人的動作(例如running、jumping,phoning,playing music instrument,等等,這也是VOC challenge的一部分)
JPEGImages: 17125張jpg圖片,包括訓練圖片和測試圖片。
SegmentationClass: 分類結果,2913張png圖片
SegmentationObject: 也是物體分割後的結果,總共2913張png圖片。
注意2個分割後圖片標籤的區別 :
* SegmentationClass: 標註出每一個像素的類別 ;
* SegmentationObject:: 標註出每一個像素屬於哪一個物體。
二、增強pascal voc2012 數據集
解壓之後是benchmark_RELEASE,benchmark_code_RELEASE沒有什麼可講的,主要說一下dataset。
cls: 11335個.mat格式的標籤;
img:11335張jpg圖片;
inst: 也是11335個.mat格式的標籤。