关于深度学习中batch_size对于模型的影响笔记

  • 较大的batch_size能够得到更加精准的梯度估计,但是回报小于线性。
  • 较小的batch_size能够带来更好的泛化误差。
    • 由于小batch_size再学习过程中带来了噪声,会产生一些正则化效果。
    • 由于梯度估计的高方差,小batch_size在训练中需要更小的学习率以保持稳定性,这意味着更长的训练时间
  • 当batch_size设置为2的次幂时能够充分利用矩阵运算。

参考《深度学习》8.13

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章