深度学习_深度学习基础知识_PReLU

原創

2020-03-13 04:50

PReLU简介

PReLU(Parametric Rectified Linear Unit), 顾名思义：带参数的ReLU。二者的定义和区别如下图：

如果ai=0，那么PReLU退化为ReLU；如果ai是一个很小的固定值(如ai=0.01)，则PReLU退化为Leaky ReLU(LReLU)。有实验证明，与ReLU相比，LReLU对最终的结果几乎没什么影响。

PReLU的几点说明

（1） PReLU只增加了极少量的参数，也就意味着网络的计算量以及过拟合的危险性都只增加了一点点。特别的，当不同channels使用相同的ai时，参数就更少了。

（2） BP更新ai时，采用的是带动量的更新方式，如下图：

上式的两个系数分别是动量和学习率。
需要特别注意的是：更新ai时不施加权重衰减(L2正则化)，因为这会把ai很大程度上push到0。事实上，即使不加正则化，试验中ai也很少有超过1的。

（3）常初始化为0.25。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

深度学习_深度学习基础知识_使用softmax和sigmoid来做多分类和多标签分类

多分類和多標籤分類的區別多分類：一個樣本屬於且只屬於多個分類中的一個，一個樣本只能屬於一個類，不同類之間是互斥的，比如圖片中一個狗只能被劃分成狗，不能被劃分成貓。多標籤分類：一個樣本可以屬於多個類別（或標籤），不同類之間有

2020-07-06 10:55:48

深度学习_深度学习基础知识_Gradient Clipping公式解释

啥也不說直接上公式：先求出梯度g，並設置梯度閾值threshold。我們再求出梯度的L2範數||g||，我們比較||g||和threshold的大小，如果||g||比threshold大，我們接着對梯度進行縮放。我們求出縮放因

2020-07-03 00:41:58

深度学习_深度学习基础知识_dropout

2020-04-20 14:07:50

深度学习_深度学习基础知识_数据归一化

2020-03-24 02:32:47

深度学习_深度学习基础知识_Adagrad

2020-03-14 07:44:49

深度学习_深度学习基础知识_全局平均池化（Global Average Pooling）

2020-03-13 04:50:41

深度学习_深度学习基础知识_奥卡姆剃刀定律

2020-03-09 17:53:25

深度学习_深度学习基础知识_激活函数

2020-03-07 12:15:21

深度学习_深度学习基础知识_使用softmax和sigmoid来做多分类和多标签分类

多分類和多標籤分類的區別多分類：一個樣本屬於且只屬於多個分類中的一個，一個樣本只能屬於一個類，不同類之間是互斥的，比如圖片中一個狗只能被劃分成狗，不能被劃分成貓。多標籤分類：一個樣本可以屬於多個類別（或標籤），不同類之間有

2020-07-06 10:55:48

深度学习_深度学习基础知识_Gradient Clipping公式解释

啥也不說直接上公式：先求出梯度g，並設置梯度閾值threshold。我們再求出梯度的L2範數||g||，我們比較||g||和threshold的大小，如果||g||比threshold大，我們接着對梯度進行縮放。我們求出縮放因

2020-07-03 00:41:58

深度学习_深度学习基础知识_dropout

2020-04-20 14:07:50

深度学习_深度学习基础知识_数据归一化

2020-03-24 02:32:47

深度学习_深度学习基础知识_Adagrad

2020-03-14 07:44:49

深度学习_深度学习基础知识_全局平均池化（Global Average Pooling）

2020-03-13 04:50:41

深度学习_深度学习基础知识_奥卡姆剃刀定律

2020-03-09 17:53:25

24小時熱門文章

最新文章

最新評論文章