說明幾點
1.model.zerp_grad()和optimzer.zero_grad(model.parameter())等效
2.optimzer只會優化model.parameter()的權值
3.遇到require_grad=False或者violatile=True的則由於根本就不求梯度,所以也不優化
說明幾點
1.model.zerp_grad()和optimzer.zero_grad(model.parameter())等效
2.optimzer只會優化model.parameter()的權值
3.遇到require_grad=False或者violatile=True的則由於根本就不求梯度,所以也不優化