關於深度學習中batch_size對於模型的影響

  • 較大的batch_size能夠得到更加精準的梯度估計,但是回報小於線性。
  • 較小的batch_size能夠帶來更好的泛化誤差。
    • 由於小batch_size再學習過程中帶來了噪聲,會產生一些正則化效果。
    • 由於梯度估計的高方差,小batch_size在訓練中需要更小的學習率以保持穩定性,這意味着更長的訓練時間
  • 當batch_size設置爲2的次冪時能夠充分利用矩陣運算。

參考《深度學習》8.13

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章