《深度學習框架PyTorch:入門與實踐》 讀書筆記

《深度學習框架PyTorch:入門與實踐》 讀書筆記

如下代碼是在 jupyter notebook中運行

%env LS_COLORS = None
#列出該目錄下的文件夾
!tree  ./dogcat
import torch as t
from torch.utils import data
import os
from PIL import Image
import numpy as np

'''
在pytorch中,數據加載可通過自定義的數據集對象實現。
數據集對象被抽象爲Dataset類,實現自定義的數據集需要繼承DataSet
'''
class DogCat(data.Dataset):
    def __init__(self,root):
        imgs = os.listdir(root)
        '''
        所有圖片的絕對路徑,這裏實際不加載圖片,只是指定路徑
        當調用__getitem__時纔會真正讀取圖片
        '''
        self.imgs = [os.path.join(root,img) for img in imgs]
    
    def __getitem__(self,index):
        # 01.得到圖形的物理地址
        img_path = self.imgs[index]
        # 02.dog->1, cat->0
        label=1 if 'dog' in img_path.split('/')[-1] else 0
        #open(img_path): Opens and identifies the given image file.
        pil_img = Image.open(img_path)
        # print(type(pil_img))  # 其類型是=> <class 'PIL.JpegImagePlugin.JpegImageFile'>
        np.asarray??
        #np.asarray(): Convert the input to an array => 把圖片對象作爲輸入,並轉換成一個數組
        array=np.asarray(pil_img)
        data=t.from_numpy(array)# 將這個數組轉換成一個tensor
        # print(type(data)) # -> <class 'torch.Tensor'>
        return data,label
    
    def __len__(self):
        return len(self.imgs)

'''
01.dataset 是DogCat的一個實例,該實例具有的屬性是imgs屬性
02.
'''    
dataset = DogCat('./dogcat/')

print("==輸出dataset中imgs的類型的具體信息==")
print(type(dataset.imgs))
print(type(dataset.imgs).__name__)
print("===============")
print(dataset.imgs)

"""
01.dataset[0] 相當於調用dataset.__getitem__(0),所以它會返回兩個值,分別是data,label; 然後賦值給img,label。
即img = data, label = label.
"""
img,label=dataset[0] 

for img ,label in dataset:
    print(img.size(),img.float().mean(),label)
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章