數據集 | 介紹 | 備註 | 網址 |
---|---|---|---|
Flickr30k | 圖片描述 | 31,783 images,每張圖片5個語句標註 | 鏈接 |
Microsoft COCO | 圖片描述 | 330,000 images,每張圖片至少5個語句標註 | 鏈接 |
ESP Game | 多標籤定義圖像 | 20,770 images,268 tags,諸如bed, light man,music | 鏈接 |
IAPRTC-12 | 多標籤定義圖像 | 19,452 images,291 tags | 鏈接 |
NUS-WIDE | 多標籤定義圖像 | 269,648 images,several tags (2-5 on average) per image | 鏈接 |
CUHK-PEDES | 以文搜圖 | 34,054 images,每張圖片2條描述 | 鏈接 |
VRD | 視覺關係檢測 | 5,000 images, 100目錄,37,993對關係 | 鏈接 |
sVG | 視覺關係檢測 | 108,000 images, 998,000對關係 | 鏈接 |
Visual Genome Dataset | 圖像屬性檢測 | 108,077 images, 5.4 M 區域塊,2.8 M 屬性,2.3 M 關係 | 鏈接 |
VQA | 問答系統 | 1,105,904問題,11,059,040 回答 | 鏈接 |
Visual7W | 問答系統 | 327,939 問答對 | 鏈接 |
TID2013 | 圖像質量評價 | 25張參考圖像,24個失真類型 | 鏈接 |
CSIQ | 圖像質量評價 | 30張參考圖像,6個失真類型 | 鏈接 |
LIVE | 圖像質量評價 | 29張參考圖像,5個失真類型 | 鏈接 |
WATERLOO | 圖像質量評價 | 4744張參考圖像,20個失真類型 | 鏈接 |
photo .net | 圖像美觀評價 | 20,278張圖像,打分[0,10] | 鏈接 |
DPChallenge .com | 圖像美觀評價 | 16,509張圖像,打分[0,10] | 鏈接 |
CUHK | 圖像美觀評價 | 28,410張圖像,只分高質量和低質量 | 鏈接 |
AVA | 圖像美觀評價 | 255,500張圖像,打分[0,10] | 鏈接 |
Image Motion & Tracking
數據集 | 介紹 | 備註 | 網址 |
---|---|---|---|
CUHK03 | Person re-identification(人重識別) | image num:13164 person num:1360 camera num:10( 5 pairs) | 鏈接 |
CUHK02 | Person re-identification(人重識別) | image num:7264 person num:1816 camera num:10( 5 pairs) | 鏈接 |
CUHK01 | Person re-identification(人重識別) | image num:3884 person num:971 camera num: 2 | 鏈接 |
VIPeR | Person re-identification(人重識別) | image num:1264 person num:632 camera num:2 | 鏈接 |
ETH1,2,3 | Person re-identification(人重識別) | image num:8580 person num:83,35,28 camera num:1 | 鏈接 |
PRID2011 | Person re-identification(人重識別) | image num:24541 person num:934 camera num:2 | 鏈接 |
MARS | Person re-identification(人重識別) | image num:11910031 person num:1261 camera num:6 | 鏈接 |
Market1501 | Person re-identification(人重識別) | image num:32217 person num:1501 camera num:6 | 鏈接 |
Epic Fail (EF) dataset | Risk Assessment(風險評估) | video num:3000 | 鏈接 |
Street Accident (SA) dataset | Risk Assessment(風險評估) | video num:1733 | 鏈接 |
OTB-50 | visual tracking(跟蹤) | video num:50 | 鏈接 |
OTB-100 | visual tracking(跟蹤) | video num:100 | 鏈接 |
VOT2015 | visual tracking(跟蹤) | video num:60 | 鏈接 |
ALOV300 | visual tracking(跟蹤) | video num:314 | 鏈接 |
MOT | visual tracking(跟蹤) | video num train:11 test:11 | 鏈接 |
THUMOS | Temporal action localization(動作定位) | video num:~3K activities class:20 instances:~3K | 鏈接 |
ActivityNet | Temporal action localization(動作定位) | video num:20k activities class:200 instances:7.6K | 鏈接 |
Mexaction2 | Temporal action localization(動作定位) | activities class:2 instances:1975 | 鏈接 |
FlyingChairs dataset | optical flow(光流) | image pairs:22k | 鏈接 |
FlyingThings3D | optical flow(光流) | image pairs:22k | 鏈接 |
KITTI benchmark suite | optical flow(光流) | image pairs:1600 | 鏈接 |
MPI Sintel | optical flow(光流) | image pairs:1064 | 鏈接 |
Video Analysis & Scene Understanding
數據集 | 介紹 | 備註 | 網址 |
---|---|---|---|
UCF101 | 動作行爲識別 | 13320 video,101類動作,主要是五大類:1)人-物交互;2)肢體運動;3)人-人交互;4)彈奏樂器;5)運動 | 鏈接 |
HMDB51 | 動作行爲識別 | 7000 videos,51類,包括人臉表情動作,身體動作,人與人交互等 | 鏈接 |
Moments-in-Time | 動作行爲識別 | 1,000,000 videos,339類 | 鏈接 |
ActivityNet 1.3 | 動作行爲識別 | 20,000 videos,200類 | 鏈接 |
Kinetics | 動作行爲識別 | 300,000 videos,400類 | 鏈接 |
AVA | 動作行爲識別 | 57,600 videos,80類 | 鏈接 |
Collective Activity Dataset | 羣體活動行爲識別 | 44 videos,穿叉、行走、等待、交談和排隊 五類 | 鏈接 |
Choi’s New Dataset | 羣體活動行爲識別 | 32 videos,聚會,談話,分開,一起走,追逐和排隊 六類 | None |
ActivityNet 1.3 | 檢測動作事件的起始時間和終止時間 | 20,000 videos,200類動作的起始時間和終止時間 | 鏈接 |
THUMOS | 檢測動作事件的起始時間和終止時間 | 15,000 videos,101類動作的起始時間和終止時間 | 鏈接 |
MED | 事件檢測 | 32,744 videos,20個事件 | 鏈接 |
EventNet | 事件檢測 | 90,000 videos,500個事件 | 鏈接 |
Columbia Consumer Video | 事件檢測 | 9,317 videos,20個事件 | 鏈接 |
ADE20K | 事件檢測 | 20,210 videos,900個事件 | 鏈接 |
DAVIS | 視頻主物體分割 | 50 videos,分割標註 | 鏈接 |
FBMS | 視頻主物體分割 | 59 videos,分割標註 | 鏈接 |
IJB-C | 視頻人臉識別 | 11,000 videos | 鏈接 |
YouTube Faces | 視頻人臉識別 | 3,425 videos,1595 人 | 鏈接 |
MS-Celeb-1M | 視頻人臉識別 | 1,000,000 images,21,000人 | 鏈接 |
MSVD | 視頻描述 | 1,970 videos | 鏈接 |
MSR-VTT-10K | 視頻描述 | 10,000 videos | 鏈接 |
3D Computer Vision
數據集 | 介紹 | 備註 | 網址 |
---|---|---|---|
photoface database | 基於光度立體視覺的二維和三維人臉識別數據庫 | 總共7356張圖像,包含1839個session和261個subjects | None |
NYU Depth V2 dataset | 關於RGBD 圖像場景理解的數據庫 | 提供1449張深度圖片和他們的密集2d點類標註 | 鏈接 |
SUN RGBD dataset | 是上面的NYU Depth V2 dataset的超集,多了3D bounding boxes和room layouts的標註。 | 有10,000張RGB-D圖片,有58,657個3D包圍框和146,617 個2d包圍框。 | 鏈接 |
PASCAL3D+ | 新的三維物體檢測和姿態估計數據集,從PASCAL VOC 演化而來,包含圖像,註解,和3D CAD模型 | 總共12個類,平均每個類別有3000多個實例 | 鏈接 |
IKEA | 包含典型室內場景的三維模型的數據庫,例如桌子椅子等 | 包含大約759張圖片和219個3D模型 | 鏈接 |
New Tsukuba Dataset | 包含了很多立體物體對的數據庫,用於立體物體匹配 | 總共1800個立體物體對,以及每立體對的立體視差圖、遮擋圖和不連續圖 | 鏈接 |
Oxford RobotCar Dataset | 關於戶外自動駕駛的數據集。 | 包含在駕駛汽車過程從6個攝像頭收集的2000w張圖片,和當時的激光雷達,GPS和地面實況標註。 | 鏈接 |
Middlebury V3 | 包含高分辨率物體立體視差標註的數據庫 | 包含33個類,沒有明說每類有多少數據 | 鏈接 |
ShapeNet | 包含3D模型,和3d模型的類別標註的數據集,覆蓋了常用的3D數據集PASCAL 3D+。 | 它涵蓋55個常見的對象類別,有大約51,300個3D模型 | 鏈接 |
MICC dataset | 包含了3D人臉掃描和在不同分辨率,條件和縮放級別下的幾個視頻序列的數據庫。 | 有53個人的立體人臉數據 | 鏈接 |
CMU MoCap Dataset | 包含了3D人體關鍵點標註和骨架移動標註的數據集。 | 有6個類別和23個子類別,總共2605個數據。 | 鏈接 |
DTU dataset | 關於3D場景的數據集。 | 有124個場景,每場景有49/64個位置的RGB圖像和結構光標註。 | 鏈接 |
Analyzing Humans in Images
數據集 | 介紹 | 備註 | 網址 |
---|---|---|---|
MSR-Action3D | 包含深度的動作識別數據集, 有20個動作, | 總共557個序列。 | 鏈接 |
Florence-3D | 包含深度的動作識別數據集, | 有9個動作,總共215個動作序列。 | 鏈接 |
Berkeley MHAD | 包含深度的動作識別數據集, | 有11個動作,產生660個動作序列。 | 鏈接 |
Online Action Detection | 包含深度的動作識別數據集, | 數據集包含59個長序列,包含10種不同的日常生活行爲。 | 鏈接 |
ChaLearn LAP IsoGD Dataset | RGB-D圖像的手勢識別的數據集。 | 包括47933個RGB-D手勢視頻,有249個手勢標籤。Training有35878視頻,Validation有5784個,test有6271個 | 鏈接 |
MAFA dataset | 關於面部遮擋問題的數據集 | 有30, 811張人臉和35806張有遮擋的臉組成。 | 鏈接 |
MSRC-12 Kinect Gesture Dataset | 手勢識別數據集 | 有4900張圖片,包含12個不同手勢, | 鏈接 |
2013 Chalearn Gesture Challenge dataset | 手勢識別數據集 | 有11000張圖片,包含20個不同手勢, | 鏈接 |
WIDER FACE | 人臉檢測數據集 | 有 32,203 張圖片,標註了393703個人臉。 | 鏈接 |
FDDB | 人臉檢測數據集 | 2845張圖片,標註了5171張人臉。 | 鏈接 |
300-VW dataset | 面部表情數據集 | 包含114個視頻和總計218,595幀。 | 鏈接 |
HMDB51 | 人類行爲識別的數據集 | 包含51個動作,總共有6766個視頻剪輯 | 鏈接 |
MPII Cooking Activities Dataset | 人類行爲識別的數據集 | 包含65個動作,有5609個視頻 | 鏈接 |
UCF101 | 人類行爲識別的數據集 | 包含101個動作,有13320個視頻 | 鏈接 |
IJB-A dataset | 包含視頻和圖片人臉識別的數據集 | 包含5712個圖像和2085個視頻 | 鏈接 |
YouTube celebrities | 視頻人臉識別的數據集 | 包含47位名人的1910個視頻 | 鏈接 |
COX | 視頻人臉識別的數據集 | 包含1000個主題的4000個視頻 | 鏈接 |
Human3.6M | 人體姿態估計的數據集 | 360萬張3D照片,11名受試者在4個視點下執行15個了不同的動作 | 鏈接 |
iLIDS | 行人重識別的數據集 | 476 張圖像,包含119個人 | 鏈接 |
VIPeR | 行人重識別的數據集 | 632個行人圖片對(由兩個相機拍攝) | 鏈接 |
CUHK01 | 行人重識別的數據集 | 包含971行人, 3884張圖片 | 鏈接 |
CUHK03 | 行人重識別的數據集 | 包含1360行人, 13164張圖片 | 鏈接 |
RWTH-PHOENIX-Weather multi-signer 2014 | 手語識別的數據集 | 包含了5672個德語手語的句子,有65,227個手語姿勢和799,006幀 | 鏈接 |
AFLW | 人類面部關鍵點的數據集 | 總共約有25k張臉,每幅圖像標註了大約21個位置。 | 鏈接 |
CMU mocap database | 動作識別的數據集 | 2235個數據,包含144個不同的動作。 | 鏈接 |
Georgia Tech (GT) database | 人臉識別數據庫 | 50個人每人15張人臉。 | 鏈接 |
ORL | 人臉識別數據庫 | 40個人每個人10張圖。 | 鏈接 |
Application
數據集 | 介紹 | 備註 | 網址 |
---|---|---|---|
DogCentric Activity Dataset | 第一視角的狗和人之間的相互行爲的數據集(視頻) | 總共有10類,具體數據量沒有明說,y是動作類別 | 鏈接 |
JPL First-Person Interaction Dataset | 第一視角觀察動作的數據集 | 57個視頻,8個大類,y是動作類別 | 鏈接 |
NUS-WIDE | 關於圖像文本匹配的數據集 | 269,648個圖像和對應的標籤 | 鏈接 |
LabelMe Dataset | 關於圖像文本匹配的數據集 | 3825個圖像和對應標籤 | 鏈接 |
Pascal Dataset | 關於圖像文本匹配的數據集 | 5011張訓練圖像和4952張測試圖像 | None |
ICDAR 2015 | 關於文本檢測的數據集 | 1500張訓練,1000張測試,y爲四邊形的四個頂點。 | 鏈接 |
COCO-Text | 關於文本檢測的數據集 | 63686張圖片,其中43686張被選爲訓練集,剩下的2萬用於測試。 | 鏈接 |
MSRA-TD500 | 關於文本檢測的數據集 | 300個訓練,200個測試圖像 | 鏈接 |
Microsoft 7-Scenes Dataset | 室內人體運動的數據集 | 有7種不同室內環境,每包含500-1000張圖像視頻序列。 | 鏈接 |
Oxford RobotCar | 戶外自動駕駛數據集 | 包含圖像,激光掃描結果和GPS數據。 | 鏈接 |
Low- & Mid-Level Vision
數據集 | 介紹 | 備註 | 網址 |
---|---|---|---|
Deep Video Deblurring for Hand-held Cameras | video/image deblurring(圖像去模糊) | video num:71 video time: 3-5s blurry and sharp pair image num:6708 | 鏈接 |
GOPRO dataset | video/image deblurring(圖像去模糊) | blurry and sharp pair image num:3214 train num:2103 test num:1111 | 鏈接 |
BSD68 | image restoration(圖像修復)/高斯降噪 | image num:68 | 鏈接 |
BSD100 | “image restoration(圖像修復)super resolution超分辨率重建” | image num:100 | 鏈接 |
Set5 | “image restoration(圖像修復)super resolution超分辨率重建” | image num:5 | 鏈接 |
Set14 | “image restoration(圖像修復)super resolution超分辨率重建” | image num:14 | 鏈接 |
Urban100 | “image restoration(圖像修復)super resolution超分辨率重建” | image num:100 | 鏈接 |
NYU v2 dataset | “image restoration(圖像修復)depth super resolution深度超分辨率重建” | image num:1449 | 鏈接 |
Middlebury dataset | “image restoration(圖像修復)depth super resolution深度超分辨率重建” | image pair num: 33 | 鏈接 |
alpha matting benchmark | Natural image matting(摳圖) | “train num:27,test num:8” | 鏈接 |
real image benchmark | Natural image matting(摳圖) | “train num:49300,test num:1000” | 鏈接 |
MSRA10K/MSRA-B | Image saliency detection(顯著性區域檢測) | image num(MSRA10K):10000 image num(MSRA-B):5000 | 鏈接 |
ECSSD | Image saliency detection(顯著性區域檢測) | image num:1000 | 鏈接 |
DUT-OMRON | Image saliency detection(顯著性區域檢測) | image num:5168 | 鏈接 |
PASCAL-S | Image saliency detection(顯著性區域檢測) | image num:850 | 鏈接 |
HKU-IS | Image saliency detection(顯著性區域檢測) | image num:4447 | 鏈接 |
SOD | Image saliency detection(顯著性區域檢測) | image num:300 | 鏈接 |
Describable Textures Dataset | texture synthesis(紋理合成) | image num:5640 category num:47 split train:val:test = 1:1:1 | 鏈接 |
CVPPP leaf segmentation | Instance segmentation(樣例分割) | image num: 161 train num: 128 test num: 33 | 鏈接 |
KITTI car segmentation | Instance segmentation(樣例分割) | image num: 3976 train num: 3712 test num: 144 val:120 | 鏈接 |
Cityscapes | Instance segmentation(樣例分割) | image num: 5000 train num: 2975 test num: 1525 val:500 | 鏈接 |
SYMMAX | Symmetry Detection(對稱性檢測) | image num: train:200 test:100 | 鏈接 |
WHSYMMAX | Symmetry Detection(對稱性檢測) | image num: train:228 test:100 object num: 1 | 鏈接 |
SK506 | Symmetry Detection(對稱性檢測) | image num: train:300 test:206 object num: 16 | 鏈接 |
Sym-PASCAL | Symmetry Detection(對稱性檢測) | image num: train:648 test:787 object num: 14 | 鏈接 |
Color Checker Dataset | Color constancy(顏色恆定) | image num: 568 | 鏈接 |
NUS 8-Camera Dataset | Color constancy(顏色恆定) | image num: 1736 | 鏈接 |
Text
數據集 | 介紹 | 備註 | 網址 |
---|---|---|---|
Stanford Sentiment Treebank | 文本情感分析 | 11855個句子劃分爲239231個短語,每個短語有個概率值,越小越負面,越大越正面 | 鏈接 |
IMDB | 文本情感分析 | 100,000句子,正面負面兩類 | 鏈接 |
Yelp | 文本情感分析 | 無 | 鏈接 |
Multi-Domain Sentiment Dataset(Amazon product) | 文本情感分析 | 100,000+句子,正面負面2類或強正面、弱正面、中立、弱負面、強負面5類 | 鏈接 |
SemEval | 文本情感分析 | 20,632句子,三類(正面、負面、中立) | 鏈接 |
Sentiment140(STS) | 文本情感分析 | 1,600,000句子,三類(正面、負面、中立) | 鏈接 |