在訓練的時候loss增大怎麼辦

引起這種問題的根本原因是Hessian矩陣的病態條件數
1、對學習率乘上一個參數(0.99或者0.999)使得學習率隨着學習步驟的進行而下降
2、另一種辦法就是採用現成的優化算法。

參考鏈接:https://www.zhihu.com/question/60510992

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章