单隐层BP神经网络推导

标签：神经网络

今天重新提到了多隐层神经网络，虽然还是挺简单的，但是突然发现没有理解。遂决定整理一下上学期学习的单隐层神经网络，再看看和多隐层BP有什么区别。

符号定义

输入向量：n维向量X
隐层输出向量：m维向量Y
输出向量：l维向量O
期望输出向量：l维向量d
输入层和隐层间权重矩阵V
隐层和输出层间权重矩阵W

神经网络激活函数

定义 $f(x)=\frac{1}{1+e^{-x}}$ 为激活函数

其中输出向量的值为前一层输出向量的加权和 $o_k=f(net_k),net_k=\sum_{j=0}^{m}(w_{jk}*y_j),k=1,2,...,l$

隐层输出向量的值为输入向量的加权和 $y_j=f(net_j),net_j=\sum_{i=0}^{n}(v_{ij}*x_i),j=1,2,...,m$

定义误差 $E=\frac{1}{2}(d-O)^2=\frac{1}{2}\sum_{k=1}^{l}(d_k-O_k)^2$ （这里嫌麻烦，就不展开了）

隐层与输出层间权重变化值 $\Delta w_{jk}=-\eta\frac{\partial E}{\partial w_{jk}}=-\eta\frac{\partial E}{\partial net_k}\frac{\partial net_k}{\partial w_{jk}}=-\eta \delta_k^oy_j$

输入层与隐层间权重变化值 $\Delta v_{ij}=-\eta\frac{\partial E}{\partial v_{ij}}=-\eta\frac{\partial E}{\partial net_j}\frac{\partial net_j}{\partial v_{ij}}=-\eta \delta_j^yx_i$

其中误差信号 $\delta_k^o = -\frac{\partial E}{\partial net_k}=-\frac{\partial E}{\partial o_k}\frac{\partial o_k}{\partial net_k} = -\frac{\partial E}{\partial o_k}f'(net_k)=(d_k-o_k)*o_k(1-o_k)$

误差信号 $\delta_j^y = -\frac{\partial E}{\partial net_j}=-\frac{\partial E}{\partial y_j}\frac{\partial y_j}{\partial net_j} = -\frac{\partial E}{\partial y_j}f'(net_j)=(\sum_{k=1}^{l}\delta_k^ow_{jk})*y_j(1-y_j)$

最终推得隐层输出向量与输出向量间权重变化量为 $\Delta w_{jk} = -\eta \delta_k^oy_j = \eta *(d_k-o_k)*o_k(1-o_k) *y_j$

输入向量与隐层输出向量间权重变化值 $\Delta v_{ij} = -\eta \delta_j^yx_i = \eta * (\sum_{k=1}^{l}\delta_k^ow_{jk})*y_j(1-y_j) *x_i$

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

单隐层BP神经网络推导

单隐层BP神经网络推导

符号定义

神经网络激活函数

beego學習筆記與beego+swagger部署極速入門記錄

單隱層BP神經網絡推導

虛擬機和雲服務器上k8s、dashboard、helm的簡易安裝經驗與問題

istio環境下暴露prometheus（失敗，待續）

【洛谷P1309】瑞士輪

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結