torchvision.Transform.ToTensor()將圖片正確輸入網絡

原創

2020-06-17 14:34

ToTensor()描述如下：

它會將圖片從NHWC轉換爲NCHW且變爲tensor，並且通過除以255將圖片歸一化到(0,1)。
注意，通道的順序與你讀取圖片所用的工具有關:
PIL: (R,G,G)
cv2：(B,G,R)
例子如下：

import torch
from PIL import Image
import cv2

from torchvision import transforms
import numpy


img_PIL = Image.open("000001.jpg")
img_cv2 = cv2.imread("000001.jpg")
print(img_PIL.size)       ##  WH
print(img_cv2.shape)      ##  HWC

img_PIL_np = numpy.array(img_PIL) #轉爲numpy後，變爲CHW
print(img_PIL_np.shape)   ##    HWC


tran = transforms.ToTensor()### 注意用這種寫法
img_PIL_tensor = tran(img_PIL)
img_cv2_tensor = tran(img_cv2)

print(img_PIL_tensor.size())  #CHW (RGB)
print(img_cv2_tensor.size())  #CHW (BGR)

輸出結果：
(409, 687)
(687, 409, 3)
(687, 409, 3)
torch.Size([3, 687, 409])
torch.Size([3, 687, 409])

注意：
當使用PIL.Image.open()打開圖片後，如果要使用img.shape函數，需要先將image形式轉換成array數組。
torchvision.Transform.ToTensor()這個工具在數據處理時還是非常方便的。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

torchvision.Transform.ToTensor()將圖片正確輸入網絡

釘釘打卡速度慢

Nginx R31 doc 官方文檔-01-nginx 如何安裝

Qt/C++音視頻開發74-合併標籤圖形/生成yolo運算結果圖形/文字和圖形合併成一個/水印濾鏡

挑戰程序設計競賽 2.2章習題 POJ - 3617 Best Cow Line 貪心

字節面試：MySQL什麼時候鎖表？如何防止鎖表？

.NET8連接SQL SERVER 2008 R2 報：證書鏈是由不受信任的頒發機構頒發的

golang開發環境搭建(win10)

python計算機視覺學習筆記——PIL庫的用法

Golang初學：獲取程序內存使用情況，std runtime

pytorch報錯：RuntimeError: Given groups=1, weight of size 10 3 3 3, expected input[1, 12, 12, 3]

latex 單雙欄轉化問題

Java--通過例子理解static關鍵字

word中“居中”，“標準”不能解決（公式/圖片）和文字不在一行的處理辦法

通過定義計算單天線單用戶離散輸入信號等概情況下的信道容量

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結