【TensorFlow学习笔记（二）】常用方法：激活函数

原創

2019-06-10 19:55

更新时间：2019-06-07

激活函数

tf.nn.relu()
ReLU函数，修正线性单元，在卷积神经网络中应用广泛，定义如下：
$ReLU(x)=max(0,x) \tag{1}$
ReLU函数具有如下性质：
优点：
（1）计算高效：采用ReLU函数的神经元只需要进行加、乘和比较的操作
（2）单侧抑制、宽兴奋边界：ReLU的输出可以很大，也可以为零
（3）稀疏性：对于小于0的输入，ReLU函数返回0
缺点
（1）输出非零中心化：这导致经过ReLU后，下一层的网络会引入偏置偏移，影响梯度下降的效率。
（2）容易“死亡”：如果某一层中的某个神经元在训练数据上的输出都不能激活，那么这个神经元的参数的梯度一直都会是0，在以后的训练中都不会被激活。
tf.nn.sigmoid()
sigmoid函数是一个“S”型函数，为两端饱和函数。定义如下：
$\sigma(x)=\frac{1}{1+exp(-x)} \tag{2}$
sigmoid函数是一种挤压函数，将输入压缩在(0,1)区间内，并且在定义域上面连续可导，其导数如下：
$\sigma'(x)=\sigma(x)(1-\sigma(x)) \tag{3}$
sigmoid函数在深层网络中容易发生梯度弥散，这是由于无论输入数值多大，其输出都小于1，这样多次乘积后，梯度会越来越小。
tf.nn.tanh()
tanh函数也是一种“S”型函数，其值域区间为[-1, 1]，定义为：
$tanh(x)=\frac{exp(x)-exp(-x)}{exp(x)+exp(-x)} \tag{4}$
tanh函数与sigmoid函数之间可以相互转化：
$tanh(x)=\frac{e^x-e^{-x}}{e^x+e^{-x}}=\frac{1-e^{-2x}}{1+e^{-2x}}=\frac{2}{1-e^{-2x}}-1=2\sigma(2x)-1 \tag{5}$
与sigmoid相似，tanh函数也在定义域上面连续可导，导数如下：
$tanh'(x)=1-tanh^2(x)=4\sigma(2x)(1-\sigma(2x)) \tag{6}$
tf.nn.elu()
ELU指数线性单元，是一类近似的零中心化的非线性函数，定义为：
$ELU(x)=max(0,x)+min(0,\gamma(exp(x)-1)) \tag{7}$
其中， $\gamma>=0$ 是一个超参数。
tf.nn.biaes_add()
tf.nn.crelu()
tf.nn.leaky_relu(features, alpha=0.2, name=None)
LeakyReLU在输入x<0时，保持一个很小的梯度，这样在参数更新时，不会存在死亡问题。定义如下：
$LeakyReLU(x)=max(0,x)+\alpha min(0,x) \tag{8}$
其中 $\alpha$ 是一个很小的常数，比如0.01，当 $\alpha<1$ 时，函数也可以写成：
$LeakyReLU(x)=max(x, \alpha x) \tag{9}$
tf.nn.relu6(features, name=None)
tf.nn.softplus()
Softplus函数是ReLU函数的平滑版本，定义为：
$Softplus(x)=log(1+exp(x)) \tag{10}$
Softplus函数的导数刚好是sigmoid函数，也具有单侧抑制、宽兴奋边界的特点，但是不具有稀疏激活性。
tf.nn.softsign()
tf.nn.dropout()
dropout函数用于使神经元随机失活，从而缓解过拟合问题。
注：激活函数定义在“/tensorflow/python/ops/nn.py”中。
https://github.com/tensorflow/tensorflow/blob/master/tensorflow/python/ops/nn_ops.py

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

【TensorFlow学习笔记（二）】常用方法：激活函数

激活函数

vue绑定对象，绑定的值不改变的问题

Spring Cloud 部署时如何使用 Kubernetes 作为注册中心和配置中心

KubeKey 部署 K8s v1.28.8 实战

记一些CISP-PTE题目解析

【Redis學習筆記一】Redis特點、基礎命令和數據結構

博客目錄——Spark學習筆記

博客目錄——TensorFlow學習筆記

【Paper Note】Representation Learning-Assisted Click-Through Rate Prediction (DeepMCP) 論文詳解

Scala Spark報錯 task not serializable的解決辦法

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結