说明几点
1.model.zerp_grad()和optimzer.zero_grad(model.parameter())等效
2.optimzer只会优化model.parameter()的权值
3.遇到require_grad=False或者violatile=True的则由于根本就不求梯度,所以也不优化
说明几点
1.model.zerp_grad()和optimzer.zero_grad(model.parameter())等效
2.optimzer只会优化model.parameter()的权值
3.遇到require_grad=False或者violatile=True的则由于根本就不求梯度,所以也不优化