pascal voc2012數據集介紹

本文主要介紹pascal voc2012原始數據集和增強數據集

原始pascal voc2012 數據集和增強pascal voc2012 數據集的下載地址,我在上一篇講語義分割的文章中寫到了,大家可以去找一下。

一、原始pascal voc2012 數據集

該數據集包括20個對象類:

  • person; 
  • bird; cat;cow;dog;horse;sheep;
  • aerphone;bicycle;boat;bus;car;matorbike;train;
  • bottle;chair;dining table;potted plant;sofa;monitor,
10個動作類:
running,jumping,phoning,playing music instrument,reading,riding,riding a horse,taking a photo,using a computer,walking

下載完解壓後可以看到VOCdevkit,其中包括以下幾個部分:


具體內容:

Annotations:17125個對象, .xml格式的標籤


ImageSets:包括action layout main segmentation四個部分的內容,是數據集中每一種類型圖片的信息。

其中Action下存放的是人的動作(例如running、jumping,phoning,playing music instrument,等等,這也是VOC challenge的一部分)

Layout下存放的是具有人體部位的數據(人的head、hand、feet等等,這也是VOC challenge的一部分)
Main下存放的是圖像物體識別的數據,總共分爲20類。
Segmentation下存放的是可用於分割的數據。

JPEGImages: 17125張jpg圖片,包括訓練圖片和測試圖片。


SegmentationClass: 分類結果,2913張png圖片


SegmentationObject: 也是物體分割後的結果,總共2913張png圖片。


注意2個分割後圖片標籤的區別 :
* SegmentationClass: 標註出每一個像素的類別 ;
* SegmentationObject:: 標註出每一個像素屬於哪一個物體。

二、增強pascal voc2012 數據集

解壓之後是benchmark_RELEASE,benchmark_code_RELEASE沒有什麼可講的,主要說一下dataset。


cls: 11335個.mat格式的標籤;

img:11335張jpg圖片;


inst: 也是11335個.mat格式的標籤。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章