深度學習實戰（十七）——學習率 (learning rate)的設置

原創

2020-06-29 05:22

Introduction

學習率 (learning rate)，控制模型的 學習進度 ：

lr 即 stride (步長) ，即反向傳播算法中的 η ：

學習率大小

	學習率大	學習率小
學習速度	快	慢
使用時間點	剛開始訓練時	一定輪數過後
副作用	1.易損失值爆炸；2.易振盪。	1.易過擬合；2.收斂速度慢。

學習率設置

在訓練過程中，一般根據訓練輪數設置動態變化的學習率。

剛開始訓練時：學習率以 0.01 ~ 0.001 爲宜。
一定輪數過後：逐漸減緩。
接近訓練結束：學習速率的衰減應該在100倍以上。

Note：
如果是 遷移學習 ，由於模型已在原始數據上收斂，此時應設置較小學習率 (≤10−4≤10−4) 在新數據上進行微調。

學習率減緩機制

	輪數減緩	指數減緩	分數減緩
英文名	step decay	exponential decay	1/t decay
方法	每N輪學習率減半	學習率按訓練輪數增長指數插值遞減	，k 控制減緩幅度，t 爲訓練輪數

把脈目標函數損失值曲線

理想情況下曲線應該是 滑梯式下降 [綠線]：

曲線 初始時上揚 [紅線]：

Solution：初始學習率過大導致振盪，應減小學習率，並 從頭開始訓練 。

曲線 初始時強勢下降沒多久歸於水平 [紫線]：

Solution：後期學習率過大導致 無法擬合，應減小學習率，並 重新訓練後幾輪 。

曲線 全程緩慢 [黃線]：

Solution：初始學習率過小導致 收斂慢，應增大學習率，並 從頭開始訓練 。

參考：

[1] 解析卷積神經網絡—深度學習實踐手冊
[2] 調整學習速率以優化神經網絡訓練
[3] 如何找到最優學習率

轉自：

深度學習: 學習率 (learning rate)

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

深度學習實戰（十七）——學習率 (learning rate)的設置

Introduction

學習率大小

學習率設置

學習率減緩機制

把脈目標函數損失值曲線

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

關於接口協議，你必須要知道這些！

一鍵自動化博客發佈工具,用過的人都說好(頭條篇)

01 穩定性（一）如何應對事故並做好覆盤？

美團一面：項目中有 10000 個 if else 如何優化？想了半天，被問懵了！

FolkMq v1.4.6 發佈（可以內嵌的消息中間件）

京東面試：如何進行JVM調優？

線程池那些坑爹的參數-核心線程數&最大線程數&工作隊列

Stream流常用方法總結

python3.6版本下對應的matplotlib版本

解決目標檢測API在GPU下訓練出現兩遍log的問題

AWS使用（九）——pycharm遠程連接服務器運行代碼加調試

AWS使用（七）——MobaXterm連接AWS遠程服務器

深度學習實戰（十七）——學習率 (learning rate)的設置

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

深度學習實戰（十七）——學習率 (learning rate)的設置

Introduction

學習率大小

學習率設置

學習率減緩機制

把脈 目標函數損失值 曲線

把脈目標函數損失值曲線