FASTAI筆記-2-對fit_one_cycle理解

原創

2020-06-08 08:42

學習fastai中一直對fit_one_cycle有一些不懂，今天在學習中明白了其中道理。

fit_one_cycle在訓練中，先使用較大的學習率，在逐步減小學習率。

首先，在學習的過程中逐步增大學習率目的是爲了不至於陷入局部最小值，邊學習邊計算loss。

其次，當loss曲線向上揚即變大的時候，開始減小學習率，慢慢的趨近梯度最小值，loss也會慢慢減小。就如下圖：

注：圖爲課程中的圖，我借鑑來解釋。

該圖x軸爲迭代次數，y軸爲學習率

該圖x軸爲迭代次數，y軸爲loss

結合兩個圖可以看出：

學習率首先逐漸變大，loss逐漸變小
當學習率達到訓練時給的參數時，開始下降。
隨着學習率不斷降低，loss也開始降低。

這個算法被稱爲:learning rate annealing(學習率退火算法)。

在實際應用中，舉個例子：

learn.fit_one_cycle(4, max_lr=slice(1e-2))

參數1：爲epoch

參數2：爲最大學習率，也就是學習率一開始會慢慢增加到指定的最大學習率，然後開始減小。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

谷歌發佈生態系統RLDS，可在強化學習中生成、共享和使用數據集

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-20 10:53:54

解讀數字化轉型下的數據安全：AI正在開闢新的可能性

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-19 14:03:54

谷歌聯合哈佛大學發佈最新研究，使用NeRF創建360度完整神經場景視頻

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

Martin Anderson

2021-12-16 15:08:50

什麼纔是實現元宇宙的關鍵路徑？

{"type":"doc","content":[{"type":"heading","attrs":{"align":null,"level":1}},{"type":"paragraph","attrs":{"indent":0,"nu

2021-12-13 17:08:51

洞察數據庫變革趨勢，亞馬遜雲科技正在憑藉這項技術改變着遊戲規則

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-10 16:53:54

基於英特爾x86平臺構建AI軟件生態系統 | InfoQ《公開課》

直播內容人工智能爲社會各個領域的技術帶來了無限可能，也誕生了很多優秀的應用。在這些應用背後，需要很強的計算性能和優化做支撐，爲其提供準確、及時的結果。在英特爾各代 x86 平臺上，AI 能力是如何進行演進的？AI 生態系統是怎樣的？其中又

InfoQ 中文站

2021-12-10 15:18:59

Rust核心團隊“有毒”

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-10 15:08:58

2021 re:Invent ，我們到底該關注哪些發佈？

{"type":"doc","content":[{"type":"heading","attrs":{"align":null,"level":1}},{"type":"paragraph","attrs":{"indent":0,"nu

2021-12-09 15:23:56

全球首個知識增強千億大模型來了！2600億參數，代碼將在近期開源

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"blockq

2021-12-09 13:08:52

2021星空論壇：破局創新，論道數字化轉型

InfoQ 中文站

2021-12-09 12:34:02

視頻精修一幀要花2小時？AI只要5.3毫秒

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

美图影像实验室

2021-12-07 17:58:50

DeepMind新研究登上Nature封面，這一數學難題被AI攻破了

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragr

2021-12-07 14:33:58

蘋果研究人員提出集成反演技術，可從不同機器學習模型中重建訓練數據

{"type":"doc","content":[{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"MI攻擊"}]},{

2021-12-07 10:28:54

DeepMind提出強化學習新方法，可實現人機合作

{"type":"doc","content":[{"type":"blockquote","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null

2021-12-03 08:03:54

華爲雲聯創營元宇宙高峯論壇—技術與文明·探索元宇宙背後的關鍵技術

【直播回放】每一次重大技術革命都會引領人類進入新時代，被喻爲“互聯網終極形態”的元宇宙，將會帶來什麼樣的變化。華爲雲、InfoQ攜手舉辦超前的元宇宙高端論壇，邀請產、學、研、投大咖們對元宇宙展開深入討論與交流。

InfoQ 中文站

2021-12-02 10:18:53

24小時熱門文章

最新文章

最新評論文章