深度學習開源數據集整理

數據集	介紹	備註	網址
Flickr30k	圖片描述	31,783 images，每張圖片5個語句標註	鏈接
Microsoft COCO	圖片描述	330,000 images,每張圖片至少5個語句標註	鏈接
ESP Game	多標籤定義圖像	20,770 images，268 tags，諸如bed, light man,music	鏈接
IAPRTC-12	多標籤定義圖像	19,452 images,291 tags	鏈接
NUS-WIDE	多標籤定義圖像	269,648 images,several tags (2-5 on average) per image	鏈接
CUHK-PEDES	以文搜圖	34,054 images，每張圖片2條描述	鏈接
VRD	視覺關係檢測	5,000 images, 100目錄，37,993對關係	鏈接
sVG	視覺關係檢測	108,000 images, 998,000對關係	鏈接
Visual Genome Dataset	圖像屬性檢測	108,077 images, 5.4 M 區域塊，2.8 M 屬性，2.3 M 關係	鏈接
VQA	問答系統	1,105,904問題，11,059,040 回答	鏈接
Visual7W	問答系統	327,939 問答對	鏈接
TID2013	圖像質量評價	25張參考圖像，24個失真類型	鏈接
CSIQ	圖像質量評價	30張參考圖像，6個失真類型	鏈接
LIVE	圖像質量評價	29張參考圖像，5個失真類型	鏈接
WATERLOO	圖像質量評價	4744張參考圖像，20個失真類型	鏈接
photo .net	圖像美觀評價	20,278張圖像，打分[0,10]	鏈接
DPChallenge .com	圖像美觀評價	16,509張圖像，打分[0,10]	鏈接
CUHK	圖像美觀評價	28,410張圖像，只分高質量和低質量	鏈接
AVA	圖像美觀評價	255,500張圖像，打分[0,10]	鏈接

Image Motion & Tracking

數據集	介紹	備註	網址
CUHK03	Person re-identification(人重識別)	image num:13164 person num:1360 camera num:10( 5 pairs)	鏈接
CUHK02	Person re-identification(人重識別)	image num:7264 person num:1816 camera num:10( 5 pairs)	鏈接
CUHK01	Person re-identification(人重識別)	image num:3884 person num:971 camera num: 2	鏈接
VIPeR	Person re-identification(人重識別)	image num:1264 person num:632 camera num:2	鏈接
ETH1,2,3	Person re-identification(人重識別)	image num:8580 person num:83,35,28 camera num:1	鏈接
PRID2011	Person re-identification(人重識別)	image num:24541 person num:934 camera num:2	鏈接
MARS	Person re-identification(人重識別)	image num:11910031 person num:1261 camera num:6	鏈接
Market1501	Person re-identification(人重識別)	image num:32217 person num:1501 camera num:6	鏈接
Epic Fail (EF) dataset	Risk Assessment(風險評估)	video num:3000	鏈接
Street Accident (SA) dataset	Risk Assessment(風險評估)	video num:1733	鏈接
OTB-50	visual tracking(跟蹤)	video num:50	鏈接
OTB-100	visual tracking(跟蹤)	video num:100	鏈接
VOT2015	visual tracking(跟蹤)	video num:60	鏈接
ALOV300	visual tracking(跟蹤)	video num:314	鏈接
MOT	visual tracking(跟蹤)	video num train:11 test:11	鏈接
THUMOS	Temporal action localization(動作定位)	video num:~3K activities class:20 instances:~3K	鏈接
ActivityNet	Temporal action localization(動作定位)	video num:20k activities class:200 instances:7.6K	鏈接
Mexaction2	Temporal action localization(動作定位)	activities class:2 instances:1975	鏈接
FlyingChairs dataset	optical flow(光流)	image pairs：22k	鏈接
FlyingThings3D	optical flow(光流)	image pairs：22k	鏈接
KITTI benchmark suite	optical flow(光流)	image pairs：1600	鏈接
MPI Sintel	optical flow(光流)	image pairs：1064	鏈接

Video Analysis & Scene Understanding

數據集	介紹	備註	網址
UCF101	動作行爲識別	13320 video,101類動作，主要是五大類：1)人-物交互；2)肢體運動；3)人-人交互；4)彈奏樂器；5)運動	鏈接
HMDB51	動作行爲識別	7000 videos,51類，包括人臉表情動作，身體動作，人與人交互等	鏈接
Moments-in-Time	動作行爲識別	1,000,000 videos,339類	鏈接
ActivityNet 1.3	動作行爲識別	20,000 videos,200類	鏈接
Kinetics	動作行爲識別	300,000 videos，400類	鏈接
AVA	動作行爲識別	57,600 videos，80類	鏈接
Collective Activity Dataset	羣體活動行爲識別	44 videos,穿叉、行走、等待、交談和排隊五類	鏈接
Choi’s New Dataset	羣體活動行爲識別	32 videos，聚會，談話，分開，一起走，追逐和排隊六類	None
ActivityNet 1.3	檢測動作事件的起始時間和終止時間	20,000 videos,200類動作的起始時間和終止時間	鏈接
THUMOS	檢測動作事件的起始時間和終止時間	15,000 videos，101類動作的起始時間和終止時間	鏈接
MED	事件檢測	32,744 videos,20個事件	鏈接
EventNet	事件檢測	90,000 videos，500個事件	鏈接
Columbia Consumer Video	事件檢測	9,317 videos，20個事件	鏈接
ADE20K	事件檢測	20,210 videos，900個事件	鏈接
DAVIS	視頻主物體分割	50 videos，分割標註	鏈接
FBMS	視頻主物體分割	59 videos，分割標註	鏈接
IJB-C	視頻人臉識別	11,000 videos	鏈接
YouTube Faces	視頻人臉識別	3,425 videos，1595 人	鏈接
MS-Celeb-1M	視頻人臉識別	1,000,000 images，21,000人	鏈接
MSVD	視頻描述	1,970 videos	鏈接
MSR-VTT-10K	視頻描述	10，000 videos	鏈接

3D Computer Vision

數據集	介紹	備註	網址
photoface database	基於光度立體視覺的二維和三維人臉識別數據庫	總共7356張圖像，包含1839個session和261個subjects	None
NYU Depth V2 dataset	關於RGBD 圖像場景理解的數據庫	提供1449張深度圖片和他們的密集2d點類標註	鏈接
SUN RGBD dataset	是上面的NYU Depth V2 dataset的超集，多了3D bounding boxes和room layouts的標註。	有10,000張RGB-D圖片，有58,657個3D包圍框和146,617 個2d包圍框。	鏈接
PASCAL3D+	新的三維物體檢測和姿態估計數據集，從PASCAL VOC 演化而來，包含圖像，註解，和3D CAD模型	總共12個類，平均每個類別有3000多個實例	鏈接
IKEA	包含典型室內場景的三維模型的數據庫，例如桌子椅子等	包含大約759張圖片和219個3D模型	鏈接
New Tsukuba Dataset	包含了很多立體物體對的數據庫，用於立體物體匹配	總共1800個立體物體對，以及每立體對的立體視差圖、遮擋圖和不連續圖	鏈接
Oxford RobotCar Dataset	關於戶外自動駕駛的數據集。	包含在駕駛汽車過程從6個攝像頭收集的2000w張圖片，和當時的激光雷達，GPS和地面實況標註。	鏈接
Middlebury V3	包含高分辨率物體立體視差標註的數據庫	包含33個類，沒有明說每類有多少數據	鏈接
ShapeNet	包含3D模型，和3d模型的類別標註的數據集，覆蓋了常用的3D數據集PASCAL 3D+。	它涵蓋55個常見的對象類別，有大約51,300個3D模型	鏈接
MICC dataset	包含了3D人臉掃描和在不同分辨率，條件和縮放級別下的幾個視頻序列的數據庫。	有53個人的立體人臉數據	鏈接
CMU MoCap Dataset	包含了3D人體關鍵點標註和骨架移動標註的數據集。	有6個類別和23個子類別，總共2605個數據。	鏈接
DTU dataset	關於3D場景的數據集。	有124個場景，每場景有49/64個位置的RGB圖像和結構光標註。	鏈接

Analyzing Humans in Images

數據集	介紹	備註	網址
MSR-Action3D	包含深度的動作識別數據集，有20個動作，	總共557個序列。	鏈接
Florence-3D	包含深度的動作識別數據集，	有9個動作，總共215個動作序列。	鏈接
Berkeley MHAD	包含深度的動作識別數據集，	有11個動作，產生660個動作序列。	鏈接
Online Action Detection	包含深度的動作識別數據集，	數據集包含59個長序列，包含10種不同的日常生活行爲。	鏈接
ChaLearn LAP IsoGD Dataset	RGB-D圖像的手勢識別的數據集。	包括47933個RGB-D手勢視頻，有249個手勢標籤。Training有35878視頻，Validation有5784個，test有6271個	鏈接
MAFA dataset	關於面部遮擋問題的數據集	有30, 811張人臉和35806張有遮擋的臉組成。	鏈接
MSRC-12 Kinect Gesture Dataset	手勢識別數據集	有4900張圖片，包含12個不同手勢，	鏈接
2013 Chalearn Gesture Challenge dataset	手勢識別數據集	有11000張圖片，包含20個不同手勢，	鏈接
WIDER FACE	人臉檢測數據集	有 32,203 張圖片，標註了393703個人臉。	鏈接
FDDB	人臉檢測數據集	2845張圖片，標註了5171張人臉。	鏈接
300-VW dataset	面部表情數據集	包含114個視頻和總計218,595幀。	鏈接
HMDB51	人類行爲識別的數據集	包含51個動作，總共有6766個視頻剪輯	鏈接
MPII Cooking Activities Dataset	人類行爲識別的數據集	包含65個動作，有5609個視頻	鏈接
UCF101	人類行爲識別的數據集	包含101個動作，有13320個視頻	鏈接
IJB-A dataset	包含視頻和圖片人臉識別的數據集	包含5712個圖像和2085個視頻	鏈接
YouTube celebrities	視頻人臉識別的數據集	包含47位名人的1910個視頻	鏈接
COX	視頻人臉識別的數據集	包含1000個主題的4000個視頻	鏈接
Human3.6M	人體姿態估計的數據集	360萬張3D照片，11名受試者在4個視點下執行15個了不同的動作	鏈接
iLIDS	行人重識別的數據集	476 張圖像，包含119個人	鏈接
VIPeR	行人重識別的數據集	632個行人圖片對（由兩個相機拍攝）	鏈接
CUHK01	行人重識別的數據集	包含971行人, 3884張圖片	鏈接
CUHK03	行人重識別的數據集	包含1360行人, 13164張圖片	鏈接
RWTH-PHOENIX-Weather multi-signer 2014	手語識別的數據集	包含了5672個德語手語的句子，有65,227個手語姿勢和799,006幀	鏈接
AFLW	人類面部關鍵點的數據集	總共約有25k張臉，每幅圖像標註了大約21個位置。	鏈接
CMU mocap database	動作識別的數據集	2235個數據，包含144個不同的動作。	鏈接
Georgia Tech (GT) database	人臉識別數據庫	50個人每人15張人臉。	鏈接
ORL	人臉識別數據庫	40個人每個人10張圖。	鏈接

Application

數據集	介紹	備註	網址
DogCentric Activity Dataset	第一視角的狗和人之間的相互行爲的數據集（視頻）	總共有10類，具體數據量沒有明說，y是動作類別	鏈接
JPL First-Person Interaction Dataset	第一視角觀察動作的數據集	57個視頻，8個大類，y是動作類別	鏈接
NUS-WIDE	關於圖像文本匹配的數據集	269,648個圖像和對應的標籤	鏈接
LabelMe Dataset	關於圖像文本匹配的數據集	3825個圖像和對應標籤	鏈接
Pascal Dataset	關於圖像文本匹配的數據集	5011張訓練圖像和4952張測試圖像	None
ICDAR 2015	關於文本檢測的數據集	1500張訓練，1000張測試，y爲四邊形的四個頂點。	鏈接
COCO-Text	關於文本檢測的數據集	63686張圖片，其中43686張被選爲訓練集，剩下的2萬用於測試。	鏈接
MSRA-TD500	關於文本檢測的數據集	300個訓練，200個測試圖像	鏈接
Microsoft 7-Scenes Dataset	室內人體運動的數據集	有7種不同室內環境，每包含500-1000張圖像視頻序列。	鏈接
Oxford RobotCar	戶外自動駕駛數據集	包含圖像，激光掃描結果和GPS數據。	鏈接

Low- & Mid-Level Vision

數據集	介紹	備註	網址
Deep Video Deblurring for Hand-held Cameras	video/image deblurring(圖像去模糊)	video num:71 video time: 3-5s blurry and sharp pair image num:6708	鏈接
GOPRO dataset	video/image deblurring(圖像去模糊)	blurry and sharp pair image num:3214 train num:2103 test num:1111	鏈接
BSD68	image restoration(圖像修復)/高斯降噪	image num:68	鏈接
BSD100	“image restoration(圖像修復)super resolution超分辨率重建”	image num:100	鏈接
Set5	“image restoration(圖像修復)super resolution超分辨率重建”	image num:5	鏈接
Set14	“image restoration(圖像修復)super resolution超分辨率重建”	image num:14	鏈接
Urban100	“image restoration(圖像修復)super resolution超分辨率重建”	image num:100	鏈接
NYU v2 dataset	“image restoration(圖像修復)depth super resolution深度超分辨率重建”	image num:1449	鏈接
Middlebury dataset	“image restoration(圖像修復)depth super resolution深度超分辨率重建”	image pair num: 33	鏈接
alpha matting benchmark	Natural image matting(摳圖)	“train num:27,test num:8”	鏈接
real image benchmark	Natural image matting(摳圖)	“train num:49300,test num:1000”	鏈接
MSRA10K/MSRA-B	Image saliency detection(顯著性區域檢測)	image num(MSRA10K):10000 image num(MSRA-B):5000	鏈接
ECSSD	Image saliency detection(顯著性區域檢測)	image num:1000	鏈接
DUT-OMRON	Image saliency detection(顯著性區域檢測)	image num:5168	鏈接
PASCAL-S	Image saliency detection(顯著性區域檢測)	image num:850	鏈接
HKU-IS	Image saliency detection(顯著性區域檢測)	image num:4447	鏈接
SOD	Image saliency detection(顯著性區域檢測)	image num:300	鏈接
Describable Textures Dataset	texture synthesis(紋理合成)	image num:5640 category num:47 split train:val:test = 1:1:1	鏈接
CVPPP leaf segmentation	Instance segmentation(樣例分割)	image num: 161 train num: 128 test num: 33	鏈接
KITTI car segmentation	Instance segmentation(樣例分割)	image num: 3976 train num: 3712 test num: 144 val:120	鏈接
Cityscapes	Instance segmentation(樣例分割)	image num: 5000 train num: 2975 test num: 1525 val:500	鏈接
SYMMAX	Symmetry Detection(對稱性檢測)	image num: train:200 test:100	鏈接
WHSYMMAX	Symmetry Detection(對稱性檢測)	image num: train:228 test:100 object num: 1	鏈接
SK506	Symmetry Detection(對稱性檢測)	image num: train:300 test:206 object num: 16	鏈接
Sym-PASCAL	Symmetry Detection(對稱性檢測)	image num: train:648 test:787 object num: 14	鏈接
Color Checker Dataset	Color constancy(顏色恆定)	image num: 568	鏈接
NUS 8-Camera Dataset	Color constancy(顏色恆定)	image num: 1736	鏈接

Text

數據集	介紹	備註	網址
Stanford Sentiment Treebank	文本情感分析	11855個句子劃分爲239231個短語，每個短語有個概率值，越小越負面，越大越正面	鏈接
IMDB	文本情感分析	100,000句子，正面負面兩類	鏈接
Yelp	文本情感分析	無	鏈接
Multi-Domain Sentiment Dataset(Amazon product)	文本情感分析	100,000+句子，正面負面2類或強正面、弱正面、中立、弱負面、強負面5類	鏈接
SemEval	文本情感分析	20,632句子，三類（正面、負面、中立）	鏈接
Sentiment140(STS)	文本情感分析	1,600,000句子,三類（正面、負面、中立）	鏈接

深度學習開源數據集整理

Image Motion & Tracking

Video Analysis & Scene Understanding

3D Computer Vision

Analyzing Humans in Images

Application

Low- & Mid-Level Vision

Text

DAPPER 事務 TRANSACTION

深度學習開源數據集整理

自然語言處理（NLP）：22 BERT中文命名實體識別

自然語言處理（NLP）：11 SelfAttention和transformer Encoder情感分析

人工智能-Pytorch案例實戰（1）-CNN Convolution Layer

自然語言處理（NLP）： 12 BERT文本分類

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結