深度學習開源數據集整理

數據集 介紹 備註 網址
Flickr30k 圖片描述 31,783 images,每張圖片5個語句標註 鏈接
Microsoft COCO 圖片描述 330,000 images,每張圖片至少5個語句標註 鏈接
ESP Game 多標籤定義圖像 20,770 images,268 tags,諸如bed, light man,music 鏈接
IAPRTC-12 多標籤定義圖像 19,452 images,291 tags 鏈接
NUS-WIDE 多標籤定義圖像 269,648 images,several tags (2-5 on average) per image 鏈接
CUHK-PEDES 以文搜圖 34,054 images,每張圖片2條描述 鏈接
VRD 視覺關係檢測 5,000 images, 100目錄,37,993對關係 鏈接
sVG 視覺關係檢測 108,000 images, 998,000對關係 鏈接
Visual Genome Dataset 圖像屬性檢測 108,077 images, 5.4 M 區域塊,2.8 M 屬性,2.3 M 關係 鏈接
VQA 問答系統 1,105,904問題,11,059,040 回答 鏈接
Visual7W 問答系統 327,939 問答對 鏈接
TID2013 圖像質量評價 25張參考圖像,24個失真類型 鏈接
CSIQ 圖像質量評價 30張參考圖像,6個失真類型 鏈接
LIVE 圖像質量評價 29張參考圖像,5個失真類型 鏈接
WATERLOO 圖像質量評價 4744張參考圖像,20個失真類型 鏈接
photo .net 圖像美觀評價 20,278張圖像,打分[0,10] 鏈接
DPChallenge .com 圖像美觀評價 16,509張圖像,打分[0,10] 鏈接
CUHK 圖像美觀評價 28,410張圖像,只分高質量和低質量 鏈接
AVA 圖像美觀評價 255,500張圖像,打分[0,10] 鏈接

Image Motion & Tracking

數據集 介紹 備註 網址
CUHK03 Person re-identification(人重識別) image num:13164 person num:1360 camera num:10( 5 pairs) 鏈接
CUHK02 Person re-identification(人重識別) image num:7264 person num:1816 camera num:10( 5 pairs) 鏈接
CUHK01 Person re-identification(人重識別) image num:3884 person num:971 camera num: 2 鏈接
VIPeR Person re-identification(人重識別) image num:1264 person num:632 camera num:2 鏈接
ETH1,2,3 Person re-identification(人重識別) image num:8580 person num:83,35,28 camera num:1 鏈接
PRID2011 Person re-identification(人重識別) image num:24541 person num:934 camera num:2 鏈接
MARS Person re-identification(人重識別) image num:11910031 person num:1261 camera num:6 鏈接
Market1501 Person re-identification(人重識別) image num:32217 person num:1501 camera num:6 鏈接
Epic Fail (EF) dataset Risk Assessment(風險評估) video num:3000 鏈接
Street Accident (SA) dataset Risk Assessment(風險評估) video num:1733 鏈接
OTB-50 visual tracking(跟蹤) video num:50 鏈接
OTB-100 visual tracking(跟蹤) video num:100 鏈接
VOT2015 visual tracking(跟蹤) video num:60 鏈接
ALOV300 visual tracking(跟蹤) video num:314 鏈接
MOT visual tracking(跟蹤) video num train:11 test:11 鏈接
THUMOS Temporal action localization(動作定位) video num:~3K activities class:20 instances:~3K 鏈接
ActivityNet Temporal action localization(動作定位) video num:20k activities class:200 instances:7.6K 鏈接
Mexaction2 Temporal action localization(動作定位) activities class:2 instances:1975 鏈接
FlyingChairs dataset optical flow(光流) image pairs:22k 鏈接
FlyingThings3D optical flow(光流) image pairs:22k 鏈接
KITTI benchmark suite optical flow(光流) image pairs:1600 鏈接
MPI Sintel optical flow(光流) image pairs:1064 鏈接

Video Analysis & Scene Understanding

數據集 介紹 備註 網址
UCF101 動作行爲識別 13320 video,101類動作,主要是五大類:1)人-物交互;2)肢體運動;3)人-人交互;4)彈奏樂器;5)運動 鏈接
HMDB51 動作行爲識別 7000 videos,51類,包括人臉表情動作,身體動作,人與人交互等 鏈接
Moments-in-Time 動作行爲識別 1,000,000 videos,339類 鏈接
ActivityNet 1.3 動作行爲識別 20,000 videos,200類 鏈接
Kinetics 動作行爲識別 300,000 videos,400類 鏈接
AVA 動作行爲識別 57,600 videos,80類 鏈接
Collective Activity Dataset 羣體活動行爲識別 44 videos,穿叉、行走、等待、交談和排隊 五類 鏈接
Choi’s New Dataset 羣體活動行爲識別 32 videos,聚會,談話,分開,一起走,追逐和排隊 六類 None
ActivityNet 1.3 檢測動作事件的起始時間和終止時間 20,000 videos,200類動作的起始時間和終止時間 鏈接
THUMOS 檢測動作事件的起始時間和終止時間 15,000 videos,101類動作的起始時間和終止時間 鏈接
MED 事件檢測 32,744 videos,20個事件 鏈接
EventNet 事件檢測 90,000 videos,500個事件 鏈接
Columbia Consumer Video 事件檢測 9,317 videos,20個事件 鏈接
ADE20K 事件檢測 20,210 videos,900個事件 鏈接
DAVIS 視頻主物體分割 50 videos,分割標註 鏈接
FBMS 視頻主物體分割 59 videos,分割標註 鏈接
IJB-C 視頻人臉識別 11,000 videos 鏈接
YouTube Faces 視頻人臉識別 3,425 videos,1595 人 鏈接
MS-Celeb-1M 視頻人臉識別 1,000,000 images,21,000人 鏈接
MSVD 視頻描述 1,970 videos 鏈接
MSR-VTT-10K 視頻描述 10,000 videos 鏈接

3D Computer Vision

數據集 介紹 備註 網址
photoface database 基於光度立體視覺的二維和三維人臉識別數據庫 總共7356張圖像,包含1839個session和261個subjects None
NYU Depth V2 dataset 關於RGBD 圖像場景理解的數據庫 提供1449張深度圖片和他們的密集2d點類標註 鏈接
SUN RGBD dataset 是上面的NYU Depth V2 dataset的超集,多了3D bounding boxes和room layouts的標註。 有10,000張RGB-D圖片,有58,657個3D包圍框和146,617 個2d包圍框。 鏈接
PASCAL3D+ 新的三維物體檢測和姿態估計數據集,從PASCAL VOC 演化而來,包含圖像,註解,和3D CAD模型 總共12個類,平均每個類別有3000多個實例 鏈接
IKEA 包含典型室內場景的三維模型的數據庫,例如桌子椅子等 包含大約759張圖片和219個3D模型 鏈接
New Tsukuba Dataset 包含了很多立體物體對的數據庫,用於立體物體匹配 總共1800個立體物體對,以及每立體對的立體視差圖、遮擋圖和不連續圖 鏈接
Oxford RobotCar Dataset 關於戶外自動駕駛的數據集。 包含在駕駛汽車過程從6個攝像頭收集的2000w張圖片,和當時的激光雷達,GPS和地面實況標註。 鏈接
Middlebury V3 包含高分辨率物體立體視差標註的數據庫 包含33個類,沒有明說每類有多少數據 鏈接
ShapeNet 包含3D模型,和3d模型的類別標註的數據集,覆蓋了常用的3D數據集PASCAL 3D+。 它涵蓋55個常見的對象類別,有大約51,300個3D模型 鏈接
MICC dataset 包含了3D人臉掃描和在不同分辨率,條件和縮放級別下的幾個視頻序列的數據庫。 有53個人的立體人臉數據 鏈接
CMU MoCap Dataset 包含了3D人體關鍵點標註和骨架移動標註的數據集。 有6個類別和23個子類別,總共2605個數據。 鏈接
DTU dataset 關於3D場景的數據集。 有124個場景,每場景有49/64個位置的RGB圖像和結構光標註。 鏈接

Analyzing Humans in Images

數據集 介紹 備註 網址
MSR-Action3D 包含深度的動作識別數據集, 有20個動作, 總共557個序列。 鏈接
Florence-3D 包含深度的動作識別數據集, 有9個動作,總共215個動作序列。 鏈接
Berkeley MHAD 包含深度的動作識別數據集, 有11個動作,產生660個動作序列。 鏈接
Online Action Detection 包含深度的動作識別數據集, 數據集包含59個長序列,包含10種不同的日常生活行爲。 鏈接
ChaLearn LAP IsoGD Dataset RGB-D圖像的手勢識別的數據集。 包括47933個RGB-D手勢視頻,有249個手勢標籤。Training有35878視頻,Validation有5784個,test有6271個 鏈接
MAFA dataset 關於面部遮擋問題的數據集 有30, 811張人臉和35806張有遮擋的臉組成。 鏈接
MSRC-12 Kinect Gesture Dataset 手勢識別數據集 有4900張圖片,包含12個不同手勢, 鏈接
2013 Chalearn Gesture Challenge dataset 手勢識別數據集 有11000張圖片,包含20個不同手勢, 鏈接
WIDER FACE 人臉檢測數據集 有 32,203 張圖片,標註了393703個人臉。 鏈接
FDDB 人臉檢測數據集 2845張圖片,標註了5171張人臉。 鏈接
300-VW dataset 面部表情數據集 包含114個視頻和總計218,595幀。 鏈接
HMDB51 人類行爲識別的數據集 包含51個動作,總共有6766個視頻剪輯 鏈接
MPII Cooking Activities Dataset 人類行爲識別的數據集 包含65個動作,有5609個視頻 鏈接
UCF101 人類行爲識別的數據集 包含101個動作,有13320個視頻 鏈接
IJB-A dataset 包含視頻和圖片人臉識別的數據集 包含5712個圖像和2085個視頻 鏈接
YouTube celebrities 視頻人臉識別的數據集 包含47位名人的1910個視頻 鏈接
COX 視頻人臉識別的數據集 包含1000個主題的4000個視頻 鏈接
Human3.6M 人體姿態估計的數據集 360萬張3D照片,11名受試者在4個視點下執行15個了不同的動作 鏈接
iLIDS 行人重識別的數據集 476 張圖像,包含119個人 鏈接
VIPeR 行人重識別的數據集 632個行人圖片對(由兩個相機拍攝) 鏈接
CUHK01 行人重識別的數據集 包含971行人, 3884張圖片 鏈接
CUHK03 行人重識別的數據集 包含1360行人, 13164張圖片 鏈接
RWTH-PHOENIX-Weather multi-signer 2014 手語識別的數據集 包含了5672個德語手語的句子,有65,227個手語姿勢和799,006幀 鏈接
AFLW 人類面部關鍵點的數據集 總共約有25k張臉,每幅圖像標註了大約21個位置。 鏈接
CMU mocap database 動作識別的數據集 2235個數據,包含144個不同的動作。 鏈接
Georgia Tech (GT) database 人臉識別數據庫 50個人每人15張人臉。 鏈接
ORL 人臉識別數據庫 40個人每個人10張圖。 鏈接

Application

數據集 介紹 備註 網址
DogCentric Activity Dataset 第一視角的狗和人之間的相互行爲的數據集(視頻) 總共有10類,具體數據量沒有明說,y是動作類別 鏈接
JPL First-Person Interaction Dataset 第一視角觀察動作的數據集 57個視頻,8個大類,y是動作類別 鏈接
NUS-WIDE 關於圖像文本匹配的數據集 269,648個圖像和對應的標籤 鏈接
LabelMe Dataset 關於圖像文本匹配的數據集 3825個圖像和對應標籤 鏈接
Pascal Dataset 關於圖像文本匹配的數據集 5011張訓練圖像和4952張測試圖像 None
ICDAR 2015 關於文本檢測的數據集 1500張訓練,1000張測試,y爲四邊形的四個頂點。 鏈接
COCO-Text 關於文本檢測的數據集 63686張圖片,其中43686張被選爲訓練集,剩下的2萬用於測試。 鏈接
MSRA-TD500 關於文本檢測的數據集 300個訓練,200個測試圖像 鏈接
Microsoft 7-Scenes Dataset 室內人體運動的數據集 有7種不同室內環境,每包含500-1000張圖像視頻序列。 鏈接
Oxford RobotCar 戶外自動駕駛數據集 包含圖像,激光掃描結果和GPS數據。 鏈接

Low- & Mid-Level Vision

數據集 介紹 備註 網址
Deep Video Deblurring for Hand-held Cameras video/image deblurring(圖像去模糊) video num:71 video time: 3-5s blurry and sharp pair image num:6708 鏈接
GOPRO dataset video/image deblurring(圖像去模糊) blurry and sharp pair image num:3214 train num:2103 test num:1111 鏈接
BSD68 image restoration(圖像修復)/高斯降噪 image num:68 鏈接
BSD100 “image restoration(圖像修復)super resolution超分辨率重建” image num:100 鏈接
Set5 “image restoration(圖像修復)super resolution超分辨率重建” image num:5 鏈接
Set14 “image restoration(圖像修復)super resolution超分辨率重建” image num:14 鏈接
Urban100 “image restoration(圖像修復)super resolution超分辨率重建” image num:100 鏈接
NYU v2 dataset “image restoration(圖像修復)depth super resolution深度超分辨率重建” image num:1449 鏈接
Middlebury dataset “image restoration(圖像修復)depth super resolution深度超分辨率重建” image pair num: 33 鏈接
alpha matting benchmark Natural image matting(摳圖) “train num:27,test num:8” 鏈接
real image benchmark Natural image matting(摳圖) “train num:49300,test num:1000” 鏈接
MSRA10K/MSRA-B Image saliency detection(顯著性區域檢測) image num(MSRA10K):10000 image num(MSRA-B):5000 鏈接
ECSSD Image saliency detection(顯著性區域檢測) image num:1000 鏈接
DUT-OMRON Image saliency detection(顯著性區域檢測) image num:5168 鏈接
PASCAL-S Image saliency detection(顯著性區域檢測) image num:850 鏈接
HKU-IS Image saliency detection(顯著性區域檢測) image num:4447 鏈接
SOD Image saliency detection(顯著性區域檢測) image num:300 鏈接
Describable Textures Dataset texture synthesis(紋理合成) image num:5640 category num:47 split train:val:test = 1:1:1 鏈接
CVPPP leaf segmentation Instance segmentation(樣例分割) image num: 161 train num: 128 test num: 33 鏈接
KITTI car segmentation Instance segmentation(樣例分割) image num: 3976 train num: 3712 test num: 144 val:120 鏈接
Cityscapes Instance segmentation(樣例分割) image num: 5000 train num: 2975 test num: 1525 val:500 鏈接
SYMMAX Symmetry Detection(對稱性檢測) image num: train:200 test:100 鏈接
WHSYMMAX Symmetry Detection(對稱性檢測) image num: train:228 test:100 object num: 1 鏈接
SK506 Symmetry Detection(對稱性檢測) image num: train:300 test:206 object num: 16 鏈接
Sym-PASCAL Symmetry Detection(對稱性檢測) image num: train:648 test:787 object num: 14 鏈接
Color Checker Dataset Color constancy(顏色恆定) image num: 568 鏈接
NUS 8-Camera Dataset Color constancy(顏色恆定) image num: 1736 鏈接

Text

數據集 介紹 備註 網址
Stanford Sentiment Treebank 文本情感分析 11855個句子劃分爲239231個短語,每個短語有個概率值,越小越負面,越大越正面 鏈接
IMDB 文本情感分析 100,000句子,正面負面兩類 鏈接
Yelp 文本情感分析 鏈接
Multi-Domain Sentiment Dataset(Amazon product) 文本情感分析 100,000+句子,正面負面2類或強正面、弱正面、中立、弱負面、強負面5類 鏈接
SemEval 文本情感分析 20,632句子,三類(正面、負面、中立) 鏈接
Sentiment140(STS) 文本情感分析 1,600,000句子,三類(正面、負面、中立) 鏈接
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章