VOC-2007數據集

1 VOC2007基本信息

作爲標準數據集,voc-2007 是衡量圖像分類識別能力的基準。
faster-rcnn,yolo -v1, yolo-v2都以此數據集爲最爲演示樣例,因此,有必要了解一下本數據集的組成架構。

VOC數據集共包含:訓練集(5011幅),測試集(4952幅),共計9963幅圖,共包含20個種類。

aeroplane
bicycle
bird
boat
bottle
bus
car
cat
chair
cow
diningtable
dog
horse
motorbike
person
pottedplant
sheep
sofa
train
tvmonitor

數據集的組成架構如下:

  • Annotations —目標真值區域
  • ImageSets —-類別標籤
  • JPEGImages —–圖像
  • SegmentationClass
  • SegmentationObjec

JPEGImages 中存放原始圖像,jpg格式。大小一般爲 500*375 或 375*500;
ImageSets 中有三個文件夾【Layout】【Main】【Segmentation】,分類識別我們只關注【Main】,它內部存儲類別標籤,-1表示負樣本,+1爲正樣本
*_train.txt 訓練樣本集
*_val.txt 評估樣本集
*_trainval.txt 訓練與評估樣本彙總

2 各類別統計信息

20個類別中,後面數字代表數據集中對應的的正樣本圖像個數(非目標個數)。

- 訓練集

aeroplane 238
bicycle 243
bird 330
boat 181
bottle 244
bus 186
car 713
cat 337
chair 445
cow 141
diningtable 200
dog 421
horse 287
motorbike 245
person 2008
pottedplant 245
sheep 96
sofa 229
train 261
tvmonitor 256

- 測試集

aeroplane 204
bicycle 239
bird 282
boat 172
bottle 212
bus 174
car 721
cat 322
chair 417
cow 127
diningtable 190
dog 418
horse 274
motorbike 222
person 2007
pottedplant 224
sheep 97
sofa 223
train 259
tvmonitor 229

可以看出,除了person數量較多,其他類別樣本個數不算多,在如此小的數據集上,深度學習能獲得較高的分類識別結果,足以說明深度學習的強大性能。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章