模型訓練時如何設置batch_size和learning_rate

根據下圖中的文章https://arxiv.org/abs/1706.02677提出的Linear Scale Rule:

學習的大小要和總batch_size成正比(同時考慮每個GPU處理的圖片數量和GPU數量)

                                                                                  圖1 文章名字

 

 
                                                   圖2 linear scale rule

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章