【最佳實踐】.pth還是.tar？

原創

2020-02-21 10:54

pytorch的官方教程裏提供了相關說明：

只保存模型用於以後的推斷的話使用.pth或.pt，這樣可以直接加載模型

A common PyTorch convention is to save models using either a .pt or .pth file extension.

torch.save(model, "model.pth") # or .pt
model = torch.load("model.pth")

斷點保存的話則使用.tar，加載的時候模型需要使用load_state_dict()方法

To save multiple components, organize them in a dictionary and use torch.save() to serialize the dictionary. A common PyTorch convention is to save these checkpoints using the .tar file extension.

torch.save({
            'epoch': epoch,
            'model_state_dict': model.state_dict(),
            'optimizer_state_dict': optimizer.state_dict(),
            'loss': loss,
            ...
            }, "checkpoint.tar")

...

checkpoint = torch.load("checkpoint.tar")
model.load_state_dict(checkpoint['model_state_dict'])
optimizer.load_state_dict(checkpoint['optimizer_state_dict'])
epoch = checkpoint['epoch']
loss = checkpoint['loss']

其中部份人羣喜歡使用.pth.tar來表明這不是一個簡單的壓縮tar類型的文件

其實這個問題一直有人討論，因爲pth同時也是Python的一種格式，所以有人甚至提出要更改一種後綴來區分…不過暫時不太需要考慮這個問題…

但實際上閱讀save的源碼就會發現，torch只是調用了Python的pickle來完成，而且沒有做任何的後綴名判斷，因此無論保存成什麼後綴都是可以的…

源問題鏈接

發佈了137 篇原創文章 · 獲贊 85 · 訪問量 12萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

pytorch 中的梯度計算

最近對pytorch的梯度計算產生了一點興趣，然後現在就總結一下，我看到的幾篇講得挺好的博客。創建帶有grad的tensor input = torch.tensor([1., 2., 3., 4.,], requires_gr

永远的小白虾

2020-07-07 15:03:38

Pytorch批量數據讀取方法詳解: DataLoader

在訓練模型的過程中，我們需要不斷的讀取小批量的數據樣本。Pytorch提供了data包來讀取數據。接下來我將人工生成一些數據，然後使用data包來處理數據。 import torch import numpy as np '''

2020-07-08 04:10:07

subprocess.py報錯：FileNotError: [Errno 2] No such file or directory: java: java

在運行coco計算ImageCaption得分時，出現以下錯誤： subprocess.py報錯：FileNotError: [Errno 2] No such file or directory: 'java': 'java' 原因：

清晨的光明

2020-07-08 02:37:26

Pytorch知識點與問題解決

文|Seraph 01 | 知識點 torcht.is_tensor(a) 判斷是否爲張量 Pytorch GPU環境是否正常測試代碼： import torch flag = torch.cuda.is_available(

2020-07-08 00:56:51

Pytorch: dataloader的一些使用心得

Pytorch: Dataloader的一些使用心得這篇博文不講原理，只講一些使用方法和技巧。所有提供的信息僅供參考，不要當作金科玉律。文章目錄Pytorch: Dataloader的一些使用心得基本程序框架從datalo

2020-07-07 23:40:48

Pytorch|YOWO原理及代碼詳解(二)

Pytorch|YOWO原理及代碼詳解(二) 本博客上接，Pytorch|YOWO原理及代碼詳解(一)，閱前可看。 1.正式訓練 if opt.evaluate: logging('evaluating .

2020-07-07 23:39:48

Pytorch|YOWO原理及代碼詳解(三)

Pytorch|YOWO原理及代碼詳解(三) 本博客上接， Pytorch|YOWO原理及代碼詳解(一)， Pytorch|YOWO原理及代碼詳解(二)，閱前可看。 1. test分析 if opt.evaluate:

2020-07-07 23:39:48

Pytorch|YOWO原理及代碼詳解(一)

Pytorch|YOWO原理及代碼詳解（一）閱前可看：YOWO論文翻譯 YOWO很有趣，使用價值很大，最近剛好需要，所以就研究一下。一直認爲只有把源碼看懂，才知道諸多細節，纔算真正瞭解一個算法。筆者能力有限，博文若有出錯，歡迎指

2020-07-07 23:39:37

Pytorch顯存問題

運行出現錯誤： RuntimeError: CUDA out of memory. Tried to allocate 500.00 MiB (GPU 0; 4.00 GiB total capacity; 204.39 MiB

2020-07-07 17:46:09

Kaggle手寫數字識別（Digit Recognizer）記錄

競賽地址 https://www.kaggle.com/c/digit-recognizer 苦於學了cs231n和pytorch之後沒有東西拿來練手，就去kaggle上找了一個入門競賽，MNIST手寫數字識別，這個比賽把MN

不跑步就等肥

2020-07-07 15:12:31

Pytorch搭建神經網絡基本步驟（文末附pytorch實現AlexNet）

文章參考: http://pytorch123.com/SecondSection/neural_networks/ cs231n assignment2 - http://cs231n.github.io/assignment

不跑步就等肥

2020-07-07 15:12:31

強化學習--Pytorch--DQN擴展以及Policy Gradient網絡結構

DQN改進 DQN算法存在過估計問題，可以採用Double DQN方法來進行補償。兩種方法只在下圖不同，其他地方一致。下圖公式爲 q_target 的輸出值， DQN: Double DQN: Policy Gradient

Chasing中的小强

2020-07-07 11:10:39

強化學習--Pytorch--DDPG

DDPG介紹及其示例 Deep Deterministic Policy Gradient是DeepMind團隊爲Actor-Critic方法打造的升級版本，其實也就是Actor-critic和DQN的融合版本。下面給出示例程序，

Chasing中的小强

2020-07-07 11:10:37

強化學習--Pytorch--DQN

DQN的學習效果還是很驚豔的，首先放上本次實驗的代碼。和官方給出的例子一樣，是託舉平衡杆的問題。給出視頻鏈接：強化學習DQN import torch import torch.nn as nn import torch.nn.

Chasing中的小强

2020-07-07 11:10:37

基本數據：Tensor

文章目錄基本數據：Tensor一、Tensor數據類型二、Tensor的創建與維度查看三、Tensor的組合與分塊四、Tensor的索引五、Tensor的變形基本數據：Tensor Tensor，即張量，是PyTorch中的基本

我是一名好学者

2020-07-07 10:51:10

24小時熱門文章

最新文章

最新評論文章