梯度下降算法小結

原創

2018-09-02 05:29

梯度下降一類算法小結

標籤（空格分隔）：梯度下降

以下內容爲*An overview of gradient descent optimization
algorithms*讀後筆記.

梯度下降算法變種

算法概覽

最經典的梯度下降算法有:1.梯度下降(Batch gradient descent) 2. 隨機梯度下降(Batch gradient descent) 3. mini-batch梯度下降(Mini-batch gradient descent)

算法的缺點

Batch梯度下降, 當遍歷計算整個數據集的梯度時候後, 對參數只進行了一次更新,梯度下降很可能變得很慢,同時對於數據集很大的時候內存可能不足.
隨機梯度下降每次訓練一個數據的時候就會更新一下參數.更新速度比1更快,同時1在更新的時候對相似的數據會存在計算冗餘.

Batch gradient descent performs redundant computations for large datasets, as it recomputes gradients for similar examples before each parameter update. SGD does away with this redundancy by performing one update at a time.
mini-batch梯度下降是1和2的折中,減少了參數更新時候的variance,一般mini-batch size設置爲50-256.但是他不能保證很好的收斂性.

梯度下降的挑戰

小的學習率導致學習慢, 大的學習率導致最優解附近波動
制定學習率表來動態調節, 這個表必須預先定義, 所以不能夠捕捉到數據集的一些特徵
所有參數都是相同的學習率, 如果數據很稀疏,特徵都有着不同的頻率, 就不能以相同的學習率來更新他們
當最小化非凸函數的時候, 會遇到很多次優解,必須防止無法跳出次優點.然而問題最大的就是馬鞍點

梯度下降的優化算法

1. Momentum

如上圖,帶有衝量的sgd能夠很快進入最優值附近

2. NAG(Nesterov accelerated gradient )

帶有預測的衝量, 想象一下快到最優解附近的時候,如果最優解附近梯度比較大,那麼這裏步伐就會很大導致很久才收斂,先預測未來的梯度來優化???還沒有合理解釋,顯著增加了RNN的性能

3. Adagrad

之前所有參數的學習率都是相同的,這顯然是不合理的,對於稀疏數據,對變化頻率大的數據應該使用小的學習率,變化頻率小的數據應該使用大的學習率

這裏G是一個對角矩陣, $G_{i} i 是 θ_{t, i}$ 的根號和,這就能反應變化快慢

但是這個算法有一個缺點就是, 他的學習率是一直衰減的!!!

4. Adadelta

他是Adagrad算法的改進, 主要改進Adagrad算法的激進以及一直衰減的學習率

第一步優化,其中分母是RMS形式

第二步,作者發現什麼了???

假設空間之類的,在分子添加了RMS(delta)

5. RMSprop

這個算法是Hinton自己獨立想出來的一個算法,和上一個算法有着相同想法

6. Adam

這個算法和之前動量想法一樣,分別構造了 $g, g^{2}$ 的動量

同時爲了無偏估計,除以了一個係數

7. AdaMax

對Adam分母V_t進行了泛化,原來的形式相當於L2正則,現在改爲LP正則,並讓p趨於無窮大

8. Nadam

這裏Dozat修改了NAG的算法,將原來對梯度提前的預估改爲對動量的預估

這裏NAG2在和最原始的衝量對比,發現只是修改了對比the momentum update rule 只是多一個梯度

那麼將這種變化應用到Adam就可以得到Nadam

這裏只是原本t-1時刻m的估計改爲t時刻m的估計

參考文獻
1. An overview of gradient descent optimization algorithms
2. Deep learning via Hessian-free optimization

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

省賽小結

省賽結束啦，其實能參加省賽是我的榮幸。也是賀大學霸和學長帶我飛的結果。其實省賽這段時間最爲深刻的還是大家一起在機房作比賽的感覺，那是我上大學至今最爲美好的回憶之一，在那段時間過的很充足。甚至後面幾天沒有加比賽，種感覺少什麼的樣子。漸漸

2020-06-22 08:18:53

XML----DOM4J

用DOM4J解析XML文檔簡介 vDom4j是一個簡單、靈活的開放源代碼的庫。Dom4j是由早期開發JDOM開發的。與JDOM不同的是，dom4j使用接口和抽象的人分離出來而後獨立基類，雖然Dom4j的API相對要複雜一些，但它提供了

2020-07-08 09:14:07

Chrome插件開發——踩坑記錄

記錄一下最近開發中的坑點。問題後臺腳本的persistent參數用處？ persistent屬性定義了常駐後臺的方式——當其值爲true時，表示擴展將一直在後臺運行，無論其是否正在工作；當其值爲false時，表示擴展在後

2020-07-07 02:47:22

Java常用名稱縮寫大全

名稱縮寫文章目錄名稱縮寫RDB--->redis database 儲存複製數據庫AOF--->Append-only file 僅追加文件IOC--->inversion of control 控制反轉AOP--->Aspec

2020-07-03 02:49:07

Typro & Markdown常見的基本用法

Typro & Markdown常見的基本用法學長推薦給我了一個超棒的軟件 typro，這是一個在linux,mac,win上都很好用的文件編輯器。總結一下常用的命令和語法。 1. 菜單欄菜單欄中： File中可以選擇文件導

burning_keyboard

2020-06-27 02:20:15

一些工作心得 @201910

每隔一段時間，在這裏把工作中對自己觸動最深的checkpoint羅列一下，對自己固然是一種激勵，如果能啓發大家就最好了。 Focus 溝通需要“錨定”話題。在交換信息的時候，需要Focus到具體的工作項上去。要減少以“我”，“我

2020-06-26 06:45:10

Android選取gridview並且標出選擇的順序

我們都見過QQ發送照片的時候有一個選擇照片的時候，會標識出選擇的順序。具體用語言來描述一下就是： gridview中，有很多item，當我們點擊item的時候，會在右上角標識出你已經選擇該item，並且，標識出你選擇該item的順序。如果

唯一郭大侠

2020-06-25 10:00:03

Android傳遞參數總結

Android中經常用到activity之間相關參數的傳遞。有的是利用intent來進行，有的是利用全局變量來進行。大家根據情況選定。 1：利用putExtra和intent來進行相關activity的傳值： String num1

唯一郭大侠

2020-06-25 09:10:04

Android糾正滑動刪除只能點刪除不能點Item的修改

之前寫過一個類似IOS的左劃出現刪除，點擊刪除的博客，但是在後期的開發中，遇到了一些問題，光設計前端效果的話是沒有問題的，但是發現沒有Item的點擊，一個側滑的事件和點擊item的事件監聽衝突了。所以在此做出一定的修改，也找了很多資料來了

唯一郭大侠

2020-06-25 09:10:04

Android橫向滑動的選項卡

我們這裏要實現的就是橫向滑動的選項卡，然後點擊選項卡的選項，對我們的fragment進行顯示。 fragment方面的知識，不做贅述，我的文章Android Fragment的使用，我已經說過了，大家可以參考一下。實現的滑動的選項卡並

唯一郭大侠

2020-06-25 09:10:04

PopUpWindow不一定只能從底部彈出

我們使用的時候，經常會用到一些彈出的小彈窗。我們用到的是PopupWindow，但是popupwindow不僅僅可以從底部進行彈出。其實我們完全可以根據自己的需求來對彈窗進行從X方向的右到左的彈出，左到右的彈出等等等等。在不瞭解的情況

唯一郭大侠

2020-06-25 09:10:04

Android系統自帶的Dialog

調用Android系統自帶的dialog比自定義dialog要方便很多。廢話不多說，直接上吧： new AlertDialog.Builder(AccountSafeActivity.this).setMessage("確認要接觸綁定？

唯一郭大侠

2020-06-25 09:10:04

Android的ScrollView下嵌套GridView顯示不完全問題處理

在Android中，ScrollView和GridView一起使用的話，會出現GridView顯示不完全的問題。針對這一個問題，我們對GridView進行處理。首先先寫一個MyGridView類： public class MyGri

唯一郭大侠

2020-06-25 09:10:04

【代碼練習6】利用多線程生產消費問題實現熊喫蜂蜜問題

熊喫蜂蜜問題： 2只熊，100只蜜蜂，蜜蜂每次生成的蜂蜜量爲1，罐子的容量是50，當罐子的蜂蜜量達到20時，熊就喫光。罐子使用單例設計模式實現。 import java.u

2020-06-23 23:25:43

使用Web Deploy發佈網站並自動備份

服務器下載Web Deploy並安裝，最好選自定義並全部安裝 web deploy下載地址安裝後iis的配置過程需要注意的是配置過程的“3. 配置iis webdeploy 用戶”步驟中，圖片裏的第二步的啓用遠程連接下面的選項中記

2020-06-22 03:17:33

24小時熱門文章

最新文章

最新評論文章