深度學習經典優化算法-公式彙總

原創

南瓜派三蔬

2019-09-02 17:03

—————整理自DeepLearning chapter8，主要是方便做算法的對比。

1.基礎算法

1.1 隨機梯度下降（SGD，Stochastic Gradient Descent）

隨機梯度下降可以通過從數據生成分佈中獨立地抽取的m個樣本組成的minibatch的平均梯度來無偏地估計梯度。
還有很多其他的點，比如SGD的收斂條件等，詳情請參考原書。

1.2 動量SGD（SGD with momentum）

動量方法的提出至少在1964年，與原SGD相比，主要區別在於添加了速度v。

1.3 Nesterov動量SGD（SGD with Nesterov momentum）

Nesterov Momentum是2013年提出來的。

2.自適應學習率算法（Algorithms with Adaptive Learning Rates）

2.1.AdaGrad

2011年提出的，控制梯度方便有所創新。

2.2.RMSProp

RMSProp算法（Hinton，2012）通過將梯度累積更改爲指數加權移動平均值，改進AdaGrad以使它在0非凸設置中表現更好。
還有添加動量因素的RMSP算法：

2.3.Adam

2014年提出，“Adam”源自“adaptive moments”。

3.二階優化算法

3.1 牛頓法（Newton’s Method）

牛頓法是最常用的二階優化算法。

3.2 共軛梯度法（Conjugate Gradients）

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

深度學習經典優化算法-公式彙總

1.基礎算法

1.1 隨機梯度下降（SGD，Stochastic Gradient Descent）

1.2 動量SGD（SGD with momentum）

1.3 Nesterov動量SGD（SGD with Nesterov momentum）

2.自適應學習率算法（Algorithms with Adaptive Learning Rates）

2.1.AdaGrad

2.2.RMSProp

2.3.Adam

3.二階優化算法

3.1 牛頓法（Newton’s Method）

3.2 共軛梯度法（Conjugate Gradients）

「Pygors跨平臺GUI」1：Pygors跨平臺GUI應用研究

[轉帖]

python列出centos7內存使用前50的進程信息

「Pygors跨平臺GUI」2：安裝MinGW-w64、MSYS2還是WSL2

一鍵自動化博客發佈工具,用過的人都說好(掘金篇)

通義千問 2.5 “客串” ChatGPT4，你分的清嗎？

Garnet：微軟官方基於.NET開源的高性能分佈式緩存存儲數據庫

Flink執行圖

Java響應式編程

評估統計算法在銀行僞造鈔票檢測中的價值

時間序列平穩性檢驗—R語言KPSS檢驗

pytorch實現多個模型的weights平均和修改weights

週期時間序列的傅里葉項：R-fourier()計算方法

變分自編碼器+要點綜述+代碼實現+生成圖片

LeetCode筆記：82. Remove Duplicates from Sorted List II 的普通解法

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結