miniImageNet數據集介紹

miniImageNet和omniglot數據集在元學習和小樣本學習領域應用廣泛,但是網絡上鮮有對miniImageNet數據集的介紹,因此在這裏我對這個數據集做了一個簡要的介紹。

ImageNet簡介

miniImageNet數據集節選自ImageNet數據集。ImageNet是一個非常有名的大型視覺數據集,它的建立旨在促進視覺識別研究。訓練ImageNet數據集需要消耗大量的計算資源。ImageNet爲超過1400萬張圖像進行了註釋,而且給至少100萬張圖像提供了邊框。

ImageNet包含2萬多個類別,比如:“氣球”、“輪胎”和“狗”等類別,ImageNet的每個類別均有不少於500張圖像。

訓練這麼多圖像需要消耗大量的資源,因此在2016年google DeepMind團隊Oriol Vinyals等人在ImageNet的基礎上提取出了miniImageNet數據集。

miniImageNet介紹

來源

DeepMind團隊首次將miniImageNet數據集用於小樣本學習研究,從此miniImageNet成爲了元學習和小樣本領域的基準數據集。

DeepMind的那篇小樣本學習的論文就是大名鼎鼎的Matching Network的來源: Matching Networks for One Shot Learning

miniImageNet包含100類共60000張彩色圖片,其中每類有600個樣本,每張圖片的規格爲84×8484 \times 84。通常而言,這個數據集的訓練集和測試集的類別劃分爲:80:2080:20。相比於CIFAR10數據集,miniImageNet數據集更加複雜,但更適合進行原型設計和實驗研究。

數據集架構

mini-imagenet一共有2.86GB,文件架構如下:

root/
\qquad |- images/
\qquad \qquad |- n0153282900000005.jpg
\qquad \qquad |- n0153282900000006.jpg
\qquad \qquad |- …
\qquad |- train.csv
\qquad |- test.csv
\qquad |- val.csv

數據集中圖片示例:
在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章