這段時間對於圖像哈希進行了研究,之前相關的算法總結文件中也提到了一些數據集。想了解的朋友戳這裏:http://blog.csdn.net/ying_xu/article/details/50532185
這裏對圖像領域常用的數據集的獲取做一個總結,具體的數據集的詳細信息和使用方法都可以在鏈接中學習到,先就不贅述了。
1. The 【CIFAR-10】 dataset
http://www.cs.toronto.edu/~kriz/cifar.html
2. 【IAPR TC-12】 Benchmark
http://www.imageclef.org/photodata
3. The 【MIRFLICKR】 RetrievalEvaluation
http://press.liacs.nl/mirflickr/
4. 【SUN Database】: Scene Categorization Benchmark
http://vision.princeton.edu/projects/2010/SUN/
5. The 【MNIST】 DATABASE ofhandwritten digits
http://yann.lecun.com/exdb/mnist/
6. TEXMEX: 【ANN_SIFT10K】,【ANN_SIFT1M】, 【ANN_GIST1M】, 【ANN_SIFT1B】
http://corpus-texmex.irisa.fr/
並可以找到Matlab讀取.fvecs, .ivecs和.bvecs後綴的mat文件
7. 【Tiny】 Images Dataset
http://horatio.cs.nyu.edu/mit/tiny/data/index.html
8. 【Photo Tourism】 (Exploring photo collection in 3D)
http://phototour.cs.washington.edu/
9. 【NUS-WIDE】
A Real-World Web Image Database from National University ofSingapore
http://lms.comp.nus.edu.sg/research/NUS-WIDE.htm
這個也可以參考下哦
http://www.datatang.com/data/13693
10. The 【INRIA】 Holidaydataset
http://lear.inrialpes.fr/~jegou/data.php#holidays
11. 【LabelMe】
http://labelme2.csail.mit.edu/Release3.0/browserTools/php/dataset.php
這個可以需要自己使用matlab代碼運行下載或者在線使用。
http://people.csail.mit.edu/torralba/code/spatialenvelope/
可以參考一下這個鏈接的數據:The LabelMe-12-50k dataset
http://www.ais.uni-bonn.de/download/datasets.html
這裏也提供兩個可以下載其gist特徵提取後的mat數據集:
http://cs.nyu.edu/~fergus/research/tfw_cvpr08_code.zip
http://www.cs.toronto.edu/~norouzi/research/mlh/data/LabelMe_gist.mat
12. 【ILSVRC2010】
http://www.image-net.org/challenges/LSVRC/2010/
13. 【Caltech-256】
http://www.vision.caltech.edu/Image_Datasets/Caltech256/#Benchmarks
這個比Caltech-101改進許多,建議可以使用256
也附上Caltech-101的鏈接:
http://www.vision.caltech.edu/Image_Datasets/Caltech101/
根據之前總結的算法中用到的主要就是以上這些,歡迎補充~
====================2016年6月28日 補充========================================
14. Places Database: A scene recognition database
======================2016年10月05日補充==============================================
http://deeplearning.net/datasets/
這個鏈接包含了深度學習中用到的音樂數據集, 自然圖片數據集(哈希可用),人工數據集,臉部數據集,文本,演講,推薦系統等的比較全面的數據集介紹以及詳細頁面鏈接。供參考。