pytorch將自己數據集用去訓練，dataloader

原創

2020-06-28 16:21

from torch.utils.data import DataLoader, Dataset
from torchvision import transforms
import pandas as pd
import cv2
import os
import glob


class Mydataset(Dataset):
    def __init__(self, data_dir, cls_list, transform=None, suffix="*.jpg"):
        super().__init__()
        self.data_dir = data_dir
        file_paths = []
        labels = []
        for index, cls_name in enumerate(cls_list):
            file_list = glob.glob(os.path.join(data_dir, cls_name, suffix))
            if file_list:
                file_paths.extend(file_list)
                labels.extend([index for i in file_list])
        self.df = pd.DataFrame({
            "file_paths": file_paths,
            "labels": labels
        },
                               dtype='object').values
        self.transform = transform

    def __len__(self):
        return len(self.df)

    def __getitem__(self, idex):
        img_name, label = self.df[idex]
        image = cv2.imread(img_name)
        if image.shape[2] == 1:
            image = cv2.cvtColor(image, cv2.COLOR_GRAY2RGB)
        if self.transform is not None:
            image = self.transform(image)
        return image, label


transforms_train = transforms.Compose([
    transforms.ToPILImage(),
    transforms.Resize((256, 256)),
    transforms.RandomHorizontalFlip(),  # 水平翻轉
    transforms.RandomRotation(10),  # 隨機旋轉10度
    transforms.ToTensor(),  # 將數據轉換成Tensor型
    transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
])

if __name__ == "__main__":
    train_path = '/Users/goby/data/tianshi_image/train_img'
    train_data = Mydataset(train_path, ["金", "木", "水", "火", "土"], transform=transforms_train)
    BATCH_SIZE = 64
    dataloader = DataLoader(train_data, batch_size=BATCH_SIZE, shuffle=False)
    for i_batch, sample_batched in enumerate(dataloader, 0):
        print(i_batch)

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

pytorch將自己數據集用去訓練，dataloader

使用c#強大的表達式樹實現對象的深克隆之解決循環引用的問題

痞子衡嵌入式：恩智浦i.MX RT1xxx系列MCU啓動那些事（12.A）- uSDHC eMMC啓動時間(RT1170)

GPT-4o 引領人機交互新風向，向量數據庫賽道沸騰了

企業大模型如何成爲自己數據的“百科全書”？

本地SSL證書過期輸入命令在IIS自動生成

基於Ubuntu-22.04安裝K8s-v1.28.2實驗（二）使用kube-vip實現集羣VIP訪問

.NET週刊【5月第2期 2024-05-12】

centos7.x 安裝 elasticdump(在線安裝&離線安裝）elasticsearch 升級並做數據遷移

卷積神經網絡學習資源彙總

python sklearn模型中random_state參數的意義

pytorch將自己數據集用去訓練，dataloader

在單臺服務器上創建多個節點的ES集羣

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結