pytorch基礎

原創

2019-05-10 02:10

1.訓練時順序

    #第一種寫法
    
    #梯度置零，也就是把loss關於weight的導數變成0
    optimizer.zero_grad()
    
    #前饋計算輸出和損失
    outputs = net(images)
    loss = criterion(outputs, labels)
    
    #反向傳播
    loss.backward()
    optimizer.step()

	#第二種寫法
	
	#前饋計算輸出和損失
	outputs = net(images)
	loss = criterion(outputs, labels)
    
    #梯度置零，也就是把loss關於weight的導數變成0
    optimizer.zero_grad()
    
    #反向傳播
    loss.backward()
    optimizer.step()

不管哪種寫法，都是最後進行反向傳播，至於梯度置0和前饋計算誰先誰後都行。

2.使用gpu

#1.設置decive，下面是一些常用的寫法
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
device = torch.device('cuda:0') or  device = torch.device('cuda',0)
device = torch.device('cuda',1)  or torch.device('cpu',0)   
    
#2.定義的損失需要放到gpu中，用.to(device)
self.bce_with_logits_loss = nn.BCEWithLogitsLoss().to(device)

#3.模型需要放到gpu中，用.to(device)
model = NeuralNet().to(device)

for i, (images, labels) in enumerate(train_loader):
	#4.訓練的images和labels需要放到gpu中，用.to(device)
    images = images.reshape(-1, 28 * 28).to(device)
    labels = labels.to(device)

對於1.0及以上版本使用 .to(device)，低版本的可能會使用.cuda(),作用是一樣的。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

pytorch基礎

1.訓練時順序

不管哪種寫法，都是最後進行反向傳播，至於梯度置0和前饋計算誰先誰後都行。

2.使用gpu

對於1.0及以上版本使用 .to(device)，低版本的可能會使用.cuda(),作用是一樣的。

如何使用 JS 判斷用戶是否處於活躍狀態

lightdb秒級增加列和刪除列（not null帶默認值）

lightdb數據庫超時相關控制參數

通過HPA+CronHPA組合應對業務複雜彈性伸縮場景

❤️‍🔥 Solon Cloud Event 新的事務特性與應用

lightdb mysql 8.0兼容之不可見主鍵

使用 JS 實現在瀏覽器控制檯打印圖片 console.image()

基於Ubuntu-22.04安裝K8s-v1.28.2實驗（四）使用域名訪問網站應用

Python字典的常見操作

word中常見的問題

MATLAB原樣保存imshow或者畫出來的圖像（不留白邊）

Linux服務器沒有內存的原因

安裝mathtype常見問題

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結