pascal voc2012數據集介紹

原創

2018-08-25 16:25

本文主要介紹pascal voc2012原始數據集和增強數據集

原始pascal voc2012 數據集和增強pascal voc2012 數據集的下載地址，我在上一篇講語義分割的文章中寫到了，大家可以去找一下。

一、原始pascal voc2012 數據集

該數據集包括20個對象類：

10個動作類：

running,jumping，phoning,playing music instrument,reading,riding,riding a horse,taking a photo,using a computer,walking

下載完解壓後可以看到VOCdevkit，其中包括以下幾個部分：

具體內容：

Annotations:17125個對象, .xml格式的標籤

ImageSets:包括action layout main segmentation四個部分的內容，是數據集中每一種類型圖片的信息。

其中Action下存放的是人的動作（例如running、jumping，phoning,playing music instrument,等等，這也是VOC challenge的一部分）

Layout下存放的是具有人體部位的數據（人的head、hand、feet等等，這也是VOC challenge的一部分）

Main下存放的是圖像物體識別的數據，總共分爲20類。

Segmentation下存放的是可用於分割的數據。

JPEGImages: 17125張jpg圖片,包括訓練圖片和測試圖片。

SegmentationClass: 分類結果，2913張png圖片

SegmentationObject: 也是物體分割後的結果，總共2913張png圖片。

注意2個分割後圖片標籤的區別：
* SegmentationClass: 標註出每一個像素的類別；
* SegmentationObject:: 標註出每一個像素屬於哪一個物體。

二、增強pascal voc2012 數據集

解壓之後是benchmark_RELEASE，benchmark_code_RELEASE沒有什麼可講的，主要說一下dataset。

cls: 11335個.mat格式的標籤；

img：11335張jpg圖片；

inst: 也是11335個.mat格式的標籤。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.