常見數據集簡介

ImageNet

ImageNet數據集共有1400多萬張圖片,2萬多個類別,超過百萬的圖片有明確的類別標註以及物體的位置信息。

PASCAL VOC

PASCAL(pattern analysis, statistical modelling and computational learning) VOC爲圖像分類與圖像檢測提供了一整套標準的數據集。其中常用的數據集有VOC 2007和VOC 2012。VOC圖像質量較好,標註比較完整,適合進行模型的性能檢測

VOC 2007 包含9963張標註過的圖片以及24640個物體標籤
VOC 2012 包含11530張圖片,包含20個物體類別,圖片大小約500 ×\times 375.

PASCAL VOC還提供了一套標準數據集格式,尤其是對於物體檢測領域,大部分開源物體檢測算法都提供了PASCAL VOC的數據接口。對於物體檢測,有3個重要文件夾:

  • JPEGImages:包含所有訓練與測試的圖片
  • Annotations:存放XML格式的標籤數據,每一個XML文件都對應於JPEGImages文件夾下的一張圖片
  • ImageSets:物體檢測只需要Main子文件夾,並在Main文件夾中建立Trainval.txt、train.txt、val.txt、test.txt,在個文件中記錄相應的圖片名即可

COCO(Common Objects in Context)

COCO針對物體檢測、分割、圖像語義理解和人體關節點等,擁有超過30萬張圖片,200多萬個實例及80個物體類別。相比於PASCAL VOC,COCO數據集難度更大,擁有的小物體更多,物體大小的跨度也更大

衆多開源算法也會提供以COCO格式爲標準的數據加載方式

CIFAR10

CIFAR10數據集包含十個類別:‘airplane’, ‘automobile’, ‘bird’, ‘cat’, ‘deer’, ‘dog’, ‘frog’, ‘horse’, ‘ship’, ‘truck’。圖像尺寸爲 3×32×323\times 32\times32
在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章