CIFAR-100簡介
CIFAR數據集是一組用於普適物體識別的數據集,由Alex Krizhevsky,Vinod Nair和Geoffrey Hinton收集。
Cifar-100數據集包含有60000張32X32尺寸的彩色圖片,來自100個分類,每個分類包含600張圖片。
圖片被分爲5個訓練批次(batch)和一個測試批次,每個批次包含10000個圖像。
圖片的100個分類從屬於20個超類。
CIFAR-100數據集(Python)下載
相關操作
數據集的讀入
官方數據集使用Pickle封裝,提供了轉換函數
Python3:
def unpickle(file):
import pickle
with open(file, 'rb') as fo:
dict = pickle.load(fo, encoding='bytes')
return dict
函數以字典形式返回數據集
字典屬性包括
b’firename’:圖片的文件名
b’batch_label’:圖片對應批次
b’fine_labels’:0~99,對應圖像分類的標籤
b’coarse_labels’:0~19,對應圖像超類的標籤
b’data’:10000X3072的NumPy數組,每行表示一個圖片實例,其中每個實例都以32(長)X32(寬)X3(RGB)表示。