深度學習_深度學習基礎知識_PReLU

原創

2020-03-13 04:50

PReLU簡介

PReLU(Parametric Rectified Linear Unit), 顧名思義：帶參數的ReLU。二者的定義和區別如下圖：

如果ai=0，那麼PReLU退化爲ReLU；如果ai是一個很小的固定值(如ai=0.01)，則PReLU退化爲Leaky ReLU(LReLU)。有實驗證明，與ReLU相比，LReLU對最終的結果幾乎沒什麼影響。

PReLU的幾點說明

（1） PReLU只增加了極少量的參數，也就意味着網絡的計算量以及過擬合的危險性都只增加了一點點。特別的，當不同channels使用相同的ai時，參數就更少了。

（2） BP更新ai時，採用的是帶動量的更新方式，如下圖：

上式的兩個係數分別是動量和學習率。
需要特別注意的是：更新ai時不施加權重衰減(L2正則化)，因爲這會把ai很大程度上push到0。事實上，即使不加正則化，試驗中ai也很少有超過1的。

（3）常初始化爲0.25。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

深度學習_深度學習基礎知識_使用softmax和sigmoid來做多分類和多標籤分類

多分類和多標籤分類的區別多分類：一個樣本屬於且只屬於多個分類中的一個，一個樣本只能屬於一個類，不同類之間是互斥的，比如圖片中一個狗只能被劃分成狗，不能被劃分成貓。多標籤分類：一個樣本可以屬於多個類別（或標籤），不同類之間有

2020-07-06 10:55:48

深度學習_深度學習基礎知識_Gradient Clipping公式解釋

啥也不說直接上公式：先求出梯度g，並設置梯度閾值threshold。我們再求出梯度的L2範數||g||，我們比較||g||和threshold的大小，如果||g||比threshold大，我們接着對梯度進行縮放。我們求出縮放因

2020-07-03 00:41:58

深度學習_深度學習基礎知識_dropout

2020-04-20 14:07:50

深度學習_深度學習基礎知識_數據歸一化

2020-03-24 02:32:47

深度學習_深度學習基礎知識_Adagrad

2020-03-14 07:44:49

深度學習_深度學習基礎知識_全局平均池化（Global Average Pooling）

2020-03-13 04:50:41

深度學習_深度學習基礎知識_奧卡姆剃刀定律

2020-03-09 17:53:25

深度學習_深度學習基礎知識_激活函數

2020-03-07 12:15:21

深度學習_深度學習基礎知識_使用softmax和sigmoid來做多分類和多標籤分類

多分類和多標籤分類的區別多分類：一個樣本屬於且只屬於多個分類中的一個，一個樣本只能屬於一個類，不同類之間是互斥的，比如圖片中一個狗只能被劃分成狗，不能被劃分成貓。多標籤分類：一個樣本可以屬於多個類別（或標籤），不同類之間有

2020-07-06 10:55:48

深度學習_深度學習基礎知識_Gradient Clipping公式解釋

啥也不說直接上公式：先求出梯度g，並設置梯度閾值threshold。我們再求出梯度的L2範數||g||，我們比較||g||和threshold的大小，如果||g||比threshold大，我們接着對梯度進行縮放。我們求出縮放因

2020-07-03 00:41:58

深度學習_深度學習基礎知識_dropout

2020-04-20 14:07:50

深度學習_深度學習基礎知識_數據歸一化

2020-03-24 02:32:47

深度學習_深度學習基礎知識_Adagrad

2020-03-14 07:44:49

深度學習_深度學習基礎知識_全局平均池化（Global Average Pooling）

2020-03-13 04:50:41

深度學習_深度學習基礎知識_奧卡姆剃刀定律

2020-03-09 17:53:25

24小時熱門文章

最新文章

最新評論文章