机器学习/深度学习数据集

MNIST

创建人:
Yann LeCun, Courant Institute, NYU
Corinna Cortes, Google Labs, New York
Christopher J.C. Burges, Microsoft Research, Redmond
类型:手写数字数据库,深度学习入门级经典数据集
数据量:60000,含10000条测试
网站:http://yann.lecun.com/exdb/mnist/

cifar10/cifar100

创建人:Alex Krizhevsky,Ilya Sutskever(Hinton的两位弟子)
类型:普适物体识别的数据集
数据量:CIFAR-10数据集包含60000个32*32的彩色图像,共有10类。有50000个训练图像和10000个测试图像。CIFAR100则包括了100个类。
网站:http://www.cs.toronto.edu/~kriz/cifar.html

ImageNet

创建人:FeiFei Li
类型:目前世界上图像识别最大的数据库
数据量:千万级
网站:http://www.image-net.org/

YouTube-8M

创建人:Google
类型:大型视频数据集
数据量: 800 万个 YouTube 视频的 URL,代表 50 万小时长度的视频,并带有视频标注。这些标注来自一个多样化的、包含了 4800 个知识图谱实体(Knowledge Graph entity)的集合。
网站:https://research.google.com/youtube8m/explore.html

UCI数据集

创建人:加州大学欧文分校(University of California Irvine)
类型:提出的用于机器学习的数据库
数据量:共有几百个数据集,其数目还在不断增加
网站:http://archive.ics.uci.edu/ml/

其他数据集汇总

http://dmr.cs.umn.edu/datasets.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章