pytorch學習-莫煩

https://www.bilibili.com/video/av15997678/?p=14

https://morvanzhou.github.io/tutorials/machine-learning/torch/3-04-save-reload/

要點 

訓練好了一個模型, 我們當然想要保存它, 留到下次要用的時候直接提取直接用, 這就是這節的內容啦. 我們用迴歸的神經網絡舉例實現保存提取.

保存 

我們快速地建造數據, 搭建網絡:

torch.manual_seed(1)    # reproducible

# 假數據
x = torch.unsqueeze(torch.linspace(-1, 1, 100), dim=1)  # x data (tensor), shape=(100, 1)
y = x.pow(2) + 0.2*torch.rand(x.size())  # noisy y data (tensor), shape=(100, 1)

def save():
    # 建網絡
    net1 = torch.nn.Sequential(
        torch.nn.Linear(1, 10),
        torch.nn.ReLU(),
        torch.nn.Linear(10, 1)
    )
    optimizer = torch.optim.SGD(net1.parameters(), lr=0.5)
    loss_func = torch.nn.MSELoss()

    # 訓練
    for t in range(100):
        prediction = net1(x)
        loss = loss_func(prediction, y)
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

接下來我們有兩種途徑來保存

torch.save(net1, 'net.pkl')  # 保存整個網絡
torch.save(net1.state_dict(), 'net_params.pkl')   # 只保存網絡中的參數 (速度快, 佔內存少)

提取網絡 

這種方式將會提取整個神經網絡, 網絡大的時候可能會比較慢.

def restore_net():
    # restore entire net1 to net2
    net2 = torch.load('net.pkl')
    prediction = net2(x)

只提取網絡參數 

這種方式將會提取所有的參數, 然後再放到你的新建網絡中.

def restore_params():
    # 新建 net3
    net3 = torch.nn.Sequential(
        torch.nn.Linear(1, 10),
        torch.nn.ReLU(),
        torch.nn.Linear(10, 1)
    )

    # 將保存的參數複製到 net3
    net3.load_state_dict(torch.load('net_params.pkl'))
    prediction = net3(x)

顯示結果 

調用上面建立的幾個功能, 然後出圖.

# 保存 net1 (1. 整個網絡, 2. 只有參數)
save()

# 提取整個網絡
restore_net()

# 提取網絡參數, 複製到新網絡
restore_params()

保存提取

這樣我們就能看出三個網絡完全一模一樣啦.

所以這也就是在我 github 代碼 中的每一步的意義啦.

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章