https://www.bilibili.com/video/av15997678/?p=14
https://morvanzhou.github.io/tutorials/machine-learning/torch/3-04-save-reload/
要點
訓練好了一個模型, 我們當然想要保存它, 留到下次要用的時候直接提取直接用, 這就是這節的內容啦. 我們用迴歸的神經網絡舉例實現保存提取.
保存
我們快速地建造數據, 搭建網絡:
torch.manual_seed(1) # reproducible
# 假數據
x = torch.unsqueeze(torch.linspace(-1, 1, 100), dim=1) # x data (tensor), shape=(100, 1)
y = x.pow(2) + 0.2*torch.rand(x.size()) # noisy y data (tensor), shape=(100, 1)
def save():
# 建網絡
net1 = torch.nn.Sequential(
torch.nn.Linear(1, 10),
torch.nn.ReLU(),
torch.nn.Linear(10, 1)
)
optimizer = torch.optim.SGD(net1.parameters(), lr=0.5)
loss_func = torch.nn.MSELoss()
# 訓練
for t in range(100):
prediction = net1(x)
loss = loss_func(prediction, y)
optimizer.zero_grad()
loss.backward()
optimizer.step()
接下來我們有兩種途徑來保存
torch.save(net1, 'net.pkl') # 保存整個網絡
torch.save(net1.state_dict(), 'net_params.pkl') # 只保存網絡中的參數 (速度快, 佔內存少)
提取網絡
這種方式將會提取整個神經網絡, 網絡大的時候可能會比較慢.
def restore_net():
# restore entire net1 to net2
net2 = torch.load('net.pkl')
prediction = net2(x)
只提取網絡參數
這種方式將會提取所有的參數, 然後再放到你的新建網絡中.
def restore_params():
# 新建 net3
net3 = torch.nn.Sequential(
torch.nn.Linear(1, 10),
torch.nn.ReLU(),
torch.nn.Linear(10, 1)
)
# 將保存的參數複製到 net3
net3.load_state_dict(torch.load('net_params.pkl'))
prediction = net3(x)
顯示結果
調用上面建立的幾個功能, 然後出圖.
# 保存 net1 (1. 整個網絡, 2. 只有參數)
save()
# 提取整個網絡
restore_net()
# 提取網絡參數, 複製到新網絡
restore_params()
這樣我們就能看出三個網絡完全一模一樣啦.
所以這也就是在我 github 代碼 中的每一步的意義啦.