《深度學習框架PyTorch
:入門與實踐》 讀書筆記
如下代碼是在 jupyter notebook
中運行
%env LS_COLORS = None
#列出該目錄下的文件夾
!tree ./dogcat
import torch as t
from torch.utils import data
import os
from PIL import Image
import numpy as np
'''
在pytorch中,數據加載可通過自定義的數據集對象實現。
數據集對象被抽象爲Dataset類,實現自定義的數據集需要繼承DataSet
'''
class DogCat(data.Dataset):
def __init__(self,root):
imgs = os.listdir(root)
'''
所有圖片的絕對路徑,這裏實際不加載圖片,只是指定路徑
當調用__getitem__時纔會真正讀取圖片
'''
self.imgs = [os.path.join(root,img) for img in imgs]
def __getitem__(self,index):
# 01.得到圖形的物理地址
img_path = self.imgs[index]
# 02.dog->1, cat->0
label=1 if 'dog' in img_path.split('/')[-1] else 0
#open(img_path): Opens and identifies the given image file.
pil_img = Image.open(img_path)
# print(type(pil_img)) # 其類型是=> <class 'PIL.JpegImagePlugin.JpegImageFile'>
np.asarray??
#np.asarray(): Convert the input to an array => 把圖片對象作爲輸入,並轉換成一個數組
array=np.asarray(pil_img)
data=t.from_numpy(array)# 將這個數組轉換成一個tensor
# print(type(data)) # -> <class 'torch.Tensor'>
return data,label
def __len__(self):
return len(self.imgs)
'''
01.dataset 是DogCat的一個實例,該實例具有的屬性是imgs屬性
02.
'''
dataset = DogCat('./dogcat/')
print("==輸出dataset中imgs的類型的具體信息==")
print(type(dataset.imgs))
print(type(dataset.imgs).__name__)
print("===============")
print(dataset.imgs)
"""
01.dataset[0] 相當於調用dataset.__getitem__(0),所以它會返回兩個值,分別是data,label; 然後賦值給img,label。
即img = data, label = label.
"""
img,label=dataset[0]
for img ,label in dataset:
print(img.size(),img.float().mean(),label)