視覺數據集 集錦(轉)

參考:
https://blog.csdn.net/Cydiachencc/article/details/84865194
https://blog.csdn.net/qq_14845119/article/details/51913171

0 MNIST

這個數據集主要就是手寫數字數據集,這裏的話整個數據集一共有60000張訓練圖片和10000張測試圖片。

1 Animals

這個數據集的話,是從Kaggle challenge中間的Dogs vs. Cats提取出來的。其中包括:狗、貓、熊貓。一共就3000張圖像。

2 CIFAR-10

CIFAR-10 包括60,000張 32 × 32 × 3 (RGB) 圖片,其中的feature vector 爲 3072.
CIFAR-10 包括了10個種類: airplanes, automobiles, birds, cats, deer, dogs, frogs,
horses, ships, and trucks.

3 SMILES

SMILES數據包括了人臉,其中的話人臉的話都是小夥着不笑的。
圖片的話是灰度圖片,其中的話一共有13165張灰度圖片,每張圖片的尺寸是:64∗6464∗64 64*6464∗64
整個數據集裏面的圖片都是在人臉區域做了crop,這個對我們希望在人臉上面進行數據處理的情況可以提供很大的方便。

4 kaggle:Dogs vs Cats

這裏的話,The Dogs vs. Cats challenge 是kaggle數據科學競賽的一部分,目的是看我們的算法能夠怎麼樣正確的對於我們的數據進行分類,究竟是包含狗還是貓。總共的話一共有25000張圖片,同時的話圖片的分辨率也是各不相同的。

5 PASCAL VOC

PASCALVOC 數據集是視覺對象的分類識別和檢測的一個基準測試,提供了檢測算法和學習性能的標準圖像註釋數據集和標準的評估系統。圖像如下圖所示,包含VOC2007(430M),VOC2012(1.9G)兩個下載版本。下載鏈接爲http://pjreddie.com/projects/pascal-voc-dataset-mirror/

6 FLOWER-17

Flowers-17數據集是一個17個種類的數據集,其中的話,每一個種類的話都有80張圖片。這個數據集適合進行我們的花的種類分類。
這個花的數據集的話,我們很容易出現overfitting的問題,所以說我們如果需要進行調整這個數據集的話,那麼我們需要好好的去應對一下這個數據集。

7 CALTECH-101

CALTECH-101這個數據集的話,是一個流行的在目標識別領域流行的benchmark dataset,是由Li fei-fei女神提出來的。
這個數據集一共有8677張圖像,這些圖像分別隸屬於101個種類,這裏的話物體的種類非常的多,包括:大象、自行車、足球甚至還有人類的大腦。
這個數據集的特點是:這些數據的話,各個類別之中的圖片是不均衡的,這個在我們訓練的時候,也適合我們對於這些情況進行一個特別技巧的學習。

8 ImageNet 200

這裏的話,這個數據集的話其實是斯坦福大學cs231n的課程中提出的一個作業的數據集。
這裏的話,數據集一共有500張訓練圖像,50張驗證圖像和50張測試圖像;這些圖像一共有200個分類。這裏的話每一幅圖像都是預先處理過的,尺寸是64∗6464∗64 64*6464∗64的彩色圖片。

9 Adience

在Adience 數據集當中,這個數據集的話是用來做人的年齡和性別識別的。總共有26580張圖片,人的年齡的話是在0-60歲之間。這裏的話我們數據集的整體目標是:預測圖片中主體的年紀和性別。

10 ImageNet

ImageNet是一個計算機視覺系統識別項目,是目前世界上圖像識別最大的數據庫。是美國斯坦福的計算機科學家李飛飛模擬人類的識別系統建立的。能夠從圖片識別物體。目前已經包含14197122張圖像,是已知的最大的圖像數據庫。

11 ImageNet Large Scale Visual Recognition Challenge

這裏的話我們會有一個ImageNet 大尺寸的識別挑戰。這個挑戰的話需要的是把圖片都分成1000個獨立的類別,這裏的話使用了1.2million的訓練圖像,50000張的驗證圖像和100000張測試圖像。

12 Kaggle: Facial Expression Recognition Challenge

這個數據集。裏面的話總共有35888張人臉圖像,這裏的話我們需要把人臉圖片分成7個種類:生氣、噁心、害怕、快樂、悲傷、驚訝、中性(面無表情)

13 Indoor CVPR

這裏的話這個Indoor的數據集的話,是包括一系列的室內圖像的,包括了:店鋪、房屋、休閒空間、工作空間和公共空間。這個數據集的目標非常的簡單,我們需要訓練一個數據集,這個數據集可以識別各個區域。

14 Stanford Cars

這裏的話Stanford Car數據集包括了196種類的汽車,一共有16185張圖片,這裏的話我們可以實現對於車輛的品牌,型號甚至是生產年月進行識別。

15 COCO

COCO是一種新的圖像識別,分割和加字幕標註的數據集。其主要特徵如下:(1)目標分割(2)通過上下文進行識別(3)每個圖像包含多個目標對象(4)超過300000個圖像(5)超過2000000個實例(6)80種對象(7)每個圖像包含5個字幕(8)包含100000個人的關鍵點。下載鏈接爲http://mscoco.org/

16 Labelme

Labelme是斯坦福一個學生的母親利用休息時間幫兒子做的標註,後來便發展爲一個數據集。該數據集的主要特點包括:(1)專門爲物體分類識別設計,而非僅僅是實例識別(2)專門爲學習嵌入在一個場景中的對象而設計(3)高質量的像素級別標註,包括多邊形框(polygons)和背景標註(segmentation masks)(4)物體類別多樣性大,每種物體的差異性,多樣性也大。(5)所有圖像都是自己通過相機拍攝,而非copy(6)公開的,免費的。
需要通過matlab來下載,一種奇特的下載方式,下載鏈接爲http://labelme2.csail.mit.edu/Release3.0/index.php

17 SUN

SUN數據集包含131067個圖像,由908個場景類別和4479個物體類別組成,其中背景標註的物體有313884個。圖像如下圖所示,下載鏈接爲:http://groups.csail.mit.edu/vision/SUN/

18 Caltech

Caltech是加州理工學院的圖像數據庫,包含Caltech101和Caltech256兩個數據集。該數據集是由Fei-FeiLi, Marco Andreetto, Marc 'Aurelio Ranzato在2003年9月收集而成的。Caltech101包含101種類別的物體,每種類別大約40到800個圖像,大部分的類別有大約50個圖像。Caltech256包含256種類別的物體,大約30607張圖像。下載鏈接爲http://www.vision.caltech.edu/Image_Datasets/Caltech101/

19 Corel5k

Corel5K圖像集,共包含科雷爾(Corel)公司收集整理的5000幅圖片,故名:Corel5K,可以用於科學圖像實驗:分類、檢索等。Corel5k數據集是圖像實驗的事實標準數據集。請勿用於商業用途。私底下學習交流使用。Corel圖像庫涵蓋多個主題,由若干個CD組成,每個CD包含100張大小相等的圖像,可以轉換成多種格式。每張CD代表一個語義主題,例如有公共汽車、恐龍、海灘等。Corel5k自從被提出用於圖像標註實驗後,已經成爲圖像實驗的標準數據集,被廣泛應用於標註算法性能的比較。Corel5k由50張CD組成,包含50個語義主題。
Corel5k圖像庫通常被分成三個部分:4000張圖像作爲訓練集,500張圖像作爲驗證集用來估計模型參數,其餘500張作爲測試集評價算法性能。使用驗證集尋找到最優模型參數後4000張訓練集和500張驗證集混合起來組成新的訓練集。
該圖像庫中的每張圖片被標註1~5個標註詞,訓練集中總共有374個標註詞,在測試集中總共使用了263個標註詞。圖像如下圖所示,很遺憾本人也未找到官方下載路徑,於是github上傳了一份,下載鏈接爲https://github.com/watersink/Corel5K

20 CIFAR(Canada Institude For Advanced Research)

CIFAR是由加拿大先進技術研究院的AlexKrizhevsky, Vinod Nair和Geoffrey Hinton收集而成的80百萬小圖片數據集。包含CIFAR-10和CIFAR-100兩個數據集。 Cifar-10由60000張32*32的RGB彩色圖片構成,共10個分類。50000張訓練,10000張測試(交叉驗證)。這個數據集最大的特點在於將識別遷移到了普適物體,而且應用於多分類。CIFAR-100由60000張圖像構成,包含100個類別,每個類別600張圖像,其中500張用於訓練,100張用於測試。其中這100個類別又組成了20個大的類別,每個圖像包含小類別和大類別兩個標籤。官網提供了Matlab,C,python三個版本的數據格式。圖像如下圖所示,下載鏈接爲http://www.cs.toronto.edu/~kriz/cifar.html

21 AFLW(Annotated Facial Landmarks in the Wild)

AFLW人臉數據庫,是一個包括多姿態、多視角的大規模人臉數據庫,而且每個人臉都被標註了21個特徵點。此數據庫信息量非常大,包括了各種姿態、表情、光照、種族等因素影響的圖片。AFLW人臉數據庫大約包括25000萬已手工標註的人臉圖片,其中59%爲女性,41%爲男性,大部分的圖片都是彩色,只有少部分是灰色圖片。該數據庫非常適合用於人臉識別、人臉檢測、人臉對齊等方面的研究,具有很高的研究價值。圖像如下圖所示,需要申請帳號纔可以下載,下載鏈接爲http://lrs.icg.tugraz.at/research/aflw/

22 LFW(Labeled Faces in the Wild)

LFW是一個用於研究無約束的人臉識別的數據庫。該數據集包含了從網絡收集的13000張人臉圖像,每張圖像都以被拍攝的人名命名。其中,有1680個人有兩個或兩個以上不同的照片。這些數據集唯一的限制就是它們可以被經典的Viola-Jones檢測器檢測到(a
hummor)。圖像如下圖所示,下載鏈接爲http://vis-www.cs.umass.edu/lfw/index.html#download

23 AFW(Annotated Faces in the Wild)

AFW數據集是使用Flickr(雅虎旗下圖片分享網站)圖像建立的人臉圖像庫,包含205個圖像,其中有473個標記的人臉。對於每一個人臉都包含一個長方形邊界框,6個地標和相關的姿勢角度。數據庫雖然不大,額外的好處是作者給出了其2012 CVPR的論文和程序以及訓練好的模型。圖像如下圖所示,下載鏈接爲http://www.ics.uci.edu/~xzhu/face/

24 FDDB(Face Detection Data Set and Benchmark)

FDDB數據集主要用於約束人臉檢測研究,該數據集選取野外環境中拍攝的2845個圖像,從中選擇5171個人臉圖像。是一個被廣泛使用的權威的人臉檢測平臺。圖像如下圖所示,下載鏈接爲http://vis-www.cs.umass.edu/fddb/

25 WIDER FACE

WIDER FACE是香港中文大學的一個提供更廣泛人臉數據的人臉檢測基準數據集,由YangShuo, Luo Ping ,Loy ,Chen Change ,Tang Xiaoou收集。它包含32203個圖像和393703個人臉圖像,在尺度,姿勢,閉塞,表達,裝扮,關照等方面表現出了大的變化。WIDER FACE是基於61個事件類別組織的,對於每一個事件類別,選取其中的40%作爲訓練集,10%用於交叉驗證(cross validation),50%作爲測試集。和PASCAL
VOC數據集一樣,該數據集也採用相同的指標。和MALF和Caltech數據集一樣,對於測試圖像並沒有提供相應的背景邊界框。圖像如下圖所示,下載鏈接爲http://mmlab.ie.cuhk.edu.hk/projects/WIDERFace/

26 CMU-MIT

CMU-MIT是由卡內基梅隆大學和麻省理工學院一起收集的數據集,所有圖片都是黑白的gif格式。裏面包含511個閉合的人臉圖像,其中130個是正面的人臉圖像。圖像如下圖所示,沒有找到官方鏈接,Github下載鏈接爲https://github.com/watersink/CMU-MIT

27 GENKI

GENKI數據集是由加利福尼亞大學的機器概念實驗室收集。該數據集包含GENKI-R2009a,GENKI-4K,GENKI-SZSL三個部分。GENKI-R2009a包含11159個圖像,GENKI-4K包含4000個圖像,分爲“笑”和“不笑”兩種,每個圖片的人臉的尺度大小,姿勢,光照變化,頭的轉動等都不一樣,專門用於做笑臉識別。GENKI-SZSL包含3500個圖像,這些圖像包括廣泛的背景,光照條件,地理位置,個人身份和種族等。圖像如下圖所示,下載鏈接爲http://mplab.ucsd.edu,如果進不去可以,同樣可以去下面的github下載,鏈接https://github.com/watersink/GENKI

28 IJB-A (IARPA JanusBenchmark A)

IJB-A是一個用於人臉檢測和識別的數據庫,包含24327個圖像和49759個人臉。圖像如下圖所示,需要郵箱申請相應帳號纔可以下載,下載鏈接爲http://www.nist.gov/itl/iad/ig/ijba_request.cfm

29 MALF (Multi-Attribute Labelled Faces)

MALF是爲了細粒度的評估野外環境中人臉檢測模型而設計的數據庫。數據主要來源於Internet,包含5250個圖像,11931個人臉。每一幅圖像包含正方形邊界框,俯仰、蜷縮等姿勢等。該數據集忽略了小於20*20的人臉,大約838個人臉,佔該數據集的7%。同時,該數據集還提供了性別,是否帶眼鏡,是否遮擋,是否是誇張的表情等信息。圖像如下圖所示,需要申請纔可以得到官方的下載鏈接,鏈接爲http://www.cbsr.ia.ac.cn/faceevaluation/

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章