參數更新方法

原創

2020-07-03 05:40

代碼實現

https://github.com/hsmyy/zhihuzhuanlan/blob/master/momentum.ipynb

1、梯度下降法

加大梯度下降的步長

繼續加大步長

2、動量更新

Momentum改進自SGD算法，讓每一次的參數更新方向不僅僅取決於當前位置的梯度，還受到上一次參數更新方向的影響。

v = mu * v - learning_rate * dx # integrate velocity

x += v # integrate position

3、NAG

如果預到的地點梯度比較大，更新就比較快，如果梯度比較小就更新比較慢

x_ahead = x + mu * v 通過上一次的動量v估計本次的位置，

v = mu * v - learning_rate * d x_ahead 通過估計的位置計算梯度，
x += v

4、Adagrad

cache += dx**2

x += - learning_rate * dx / (np.sqrt(cache) + eps)

這個方法其實是動態更新學習率的方法，其中cache將每個梯度的平方和相加，而更新學習率的本質是，如果求得梯度距離越大，那麼學習率就變慢，而eps是一個平滑的過程，取值通常在（10^-4~10^-8 之間）

gt,i=∇θJ(θi)是目標函數對參數的梯度，ϵ是平滑項，防止除零操作，一般取值1e−8

Adagrad的一大優勢時可以避免手動調節學習率，比如設置初始的缺省學習率爲0.01，然後就不管它，另其在學習的過程中自己變化。當然它也有缺點，就是它計算時要在分母上計算梯度平方的和，由於所有的參數平法必爲正數，這樣就造成在訓練的過程中，分母累積的和會越來越大。

5、RMSprop

cache = decay_rate * cache + (1 - decay_rate) * dx**2

x += - learning_rate * dx / (np.sqrt(cache) + eps)

6、Adam

m = beta1*m + (1-beta1)*dx

v = beta2*v + (1-beta2)*(dx**2)

x += - learning_rate * m / (np.sqrt(v) + eps)

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Windows環境下編譯 matconvnet的坑（2）

未定義函數或變量 'export_fig'。出錯 tiny_face_detector (line 197) export_fig('-dpng', '-native', '-opengl', '-transparent', out

2020-07-08 01:05:53

[3 Jun 2015 ~ 9 Jun 2015] Deep Learning in arxiv

arXiv is an e-print service in the fields of physics, mathematics, computer science, quantitative biology, quantitative

2020-07-06 23:45:22

[Fri 19 Jun 2015 ~ Thu 25 Jun 2015] Deep Learning in arxiv

A Neural Network Approach to Context-Sensitive Generation of Conversational Responses Leverage Financial News to Pr

2020-07-06 23:05:10

[DEEP LEARNING An MIT Press book in preparation]Deep Learning for AI

接觸DL已經有半年了，積累了一些實驗的經驗，也對DL有了一些自己的見解和認識，於是乎想擴寬以及加深DL方面相關的一些知識。然後看到一本MIT出版社正要出版的一本關於DL的書http://www.iro.umontreal.ca/~beng

2020-07-06 23:05:10

Deep Learning 激活函數總結

引入激活函數的意義：激活函數是用來加入非線性因素的，提高神經網絡對模型的表達能力，解決線性模型所不能解決的問題（比如線性不可分的問題）。激活函數的作用：在沒有激活函數的神經網絡中所

一条死在减速带的大鱼

2020-07-06 08:41:24

類vgg網絡實現端到端識別驗證碼

項目起因大二在做weibo爬蟲抓取用於情感分析語料時遇到了模擬登陸的問題，其中關鍵的一環就是驗證碼識別。由於當時專業知識有限選擇了對接打碼平臺來解決這個痛點，在時間不充分情況下這是效率最高的方法。但這也在我心中埋下了一個小小的種

一条死在减速带的大鱼

2020-07-06 08:00:11

windows labelme安裝與使用

1. 安裝（1）打開anacoda prompt (2) 輸入 pip install pyqt5 pip install labelme 2. 使用在anaconda prompt輸入 labelme 快捷鍵上一張圖：A 下一張

2020-07-05 20:39:35

caffe cuda docker 環境搭建

注意：在安裝過程中，要時刻提醒自己注意版本的一致性(若不一致，會走很多彎路)，包括nvidia driver cuda cudnn 和caffe ，我們需要的版本是： dirver:384以上 cuda:9.0 cudnn:7.

2020-07-05 17:09:47

經典 network -- 圖像分類篇（01 AlexNet / NIN / VGG）（持續更新）

近期，實驗室小組成員決定定期學習經典網絡模型。因此，特別準備寫這麼一個博客，持續更新我們的學習、及個人對各種經典網絡的理解。如有不足和理解不到位的地方，還望讀者提出質疑和批評，定虛心改進。望共同討論、學習和進步。系列目錄：經典 net

Phoenixtree_Zhao

2020-07-05 10:13:57

MyDLNote - Attention: [NLA系列] Asymmetric Non-local Neural Networks for Semantic Segmentation

Asymmetric Non-local Neural Networks for Semantic Segmentation Zhen Zhu , Mengde Xu , Song Bai , Tengteng Huang , Xiang

Phoenixtree_Zhao

2020-07-05 10:13:46

經典 network -- 圖像分類篇（03 ResNet v1-v2）

近期，實驗室小組成員決定定期學習經典網絡模型。因此，特別準備寫這麼一個博客，持續更新我們的學習、及個人對各種經典網絡的理解。如有不足和理解不到位的地方，還望讀者提出質疑和批評，定虛心改進。望共同討論、學習和進步。系列目錄：經典 net

Phoenixtree_Zhao

2020-07-05 10:13:45

MyDLNote - Network: Deep High-Resolution Representation Learning for Human Pose Estimation

Deep High-Resolution Representation Learning for Human Pose Estimation [paper] https://arxiv.org/pdf/1902.09212.pdf [gi

Phoenixtree_Zhao

2020-07-05 10:13:45

【轉】淺談人類視覺系統與卷積神經網絡(CNN)的聯繫和區別

淺談人類視覺系統與卷積神經網絡(CNN)的聯繫和區別文章轉載：葉強深度學習 / 強化學習 / 機器學習 / 算法 / 眼科學聲明：本文爲作者原創、歡迎免費規範轉載。本文使用的一些圖片素材來自於網絡，感謝素材提供方，如有侵權請聯繫告知

Phoenixtree_Zhao

2020-07-05 10:13:44

【轉】Knowledge-Distillation 知識蒸餾論文集合

Awesome Knowledge-Distillation 博客轉自CTOLib碼庫：https://www.ctolib.com/FLHonker-Awesome-Knowledge-Distillation.html Aweso

Phoenixtree_Zhao

2020-07-05 10:13:44

MyDLNote-Inpainting:[2019 ICCV] Free-Form Image Inpainting with Gated Convolution

Free-Form Image Inpainting with Gated Convolution 本文作者在 2018年 CVPR 上發表了一篇 Generative Image Inpainting with Contextual A

Phoenixtree_Zhao

2020-07-05 10:13:43

24小時熱門文章

通過HPA+CronHPA組合應對業務複雜彈性伸縮場景

最新文章

最新評論文章