2020-5-13 吴恩达-NN&DL-w4 深层NN(4.6 前向和反向传播(以3层NN实现为例))

1.视频网站：mooc慕课https://mooc.study.163.com/university/deeplearning_ai#/c
2.详细笔记网站(中文)：http://www.ai-start.com/dl2017/
3.github课件+作业+答案：https://github.com/stormstone/deeplearning.ai

4.6 前向和反向传播 Forward and backward propagation

上一节了解了构成深度NN的基本模块，每一层都有前向传播步骤以及一个相反的反向传播步骤，本节将介绍如何实现这些步骤。

前向传播

第l层输入a^[l-1]，输出a^[l]，保存z^[l]，W^[l]和b^[l]。

前向传播的步骤

$z^{[l]}=W^{[l]}a^{[l-1]}+b^{[l]}$
$a^{[l]}=g^{[l]}(z^{[l]})$
输入特征 $x=a^{[0]}$

向量化实现

$Z^{[l]}=W^{[l]}A^{[l-1]}+b^{[l]}$
$A^{[l]}=g^{[l]}(Z^{[l]})$
输入特征集合 $X=A^{[0]}$

反向传播

第l层输入da^[l]，输出da^[l-1]，dz^[l]，dW^[l]和db^[l]。

反向传播的步骤

$dz^{[l]}=da^{[l]}\ast g^{[l]'}(z^{[l]})$
$dW^{[l]}=dz^{[l]}a^{[l-1]}$
$db^{[l]}=dz^{[l]}$
$da^{[l-1]}=W^{[l]T}dz^{[l]}$

在3.9 神经网络的梯度下降法曾经给出过单隐层NN的dz公式

$dz^{[l]}=W^{[l+1]T}dz^{[l+1]}∗g^{[l]′}(z^{[l]})$

注意，其实2个公式是一致的。

向量化实现

$dZ^{[l]}=dA^{[l]}\ast g^{[l]'}(Z^{[l]})$
$dW^{[l]}=\frac 1m dZ^{[l]}A^{[l-1]T}$
$db^{[l]}=\frac 1m np.sum(dZ^{[l]},axis=1,keepdims=True)$
$dA^{[l-1]}=W^{[l]T}dZ^{[l]}$

汇总

输入X

第一层使用修正线性单元激活函数Relu
第二层使用另外一个Relu函数
第三层使用sigmoid函数（如果是二分分类）
输出预测值 $\hat y$
计算损失 $L(\hat y,y)$

然后开始向后迭代，反向传播求导

使用保存的 $z^{[l]}$ 来计算 $dW^{[3]}，db^{[3]}，dW^{[2]}，db^{[2]}，dW^{[1]}，db^{[1]}$
依次回传 $da^{[3]}，da^{[2]}，da^{[1]}$

以上就是一个3层NN的前向和反向传播。

前向传播，我们使用输入数据X来初始化。
对于逻辑回归的反向传播，初始化使用的是
$dA^{[l]}=(-\frac {y^{(1)}}{a^{(1)}}+\frac {1-y^{(1)}}{1-a^{(1)}}......-\frac {y^{(m)}}{a^{(m)}}+\frac {1-y^{(m)}}{1-a^{(m)}})$

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

2020-5-13 吴恩达-NN&DL-w4 深层NN(4.6 前向和反向传播(以3层NN实现为例))

4.6 前向和反向传播 Forward and backward propagation

汇总

使用c#强大的表达式树实现对象的深克隆之解决循环引用的问题

free AI online tools All In One

痞子衡嵌入式：恩智浦i.MX RT1xxx系列MCU启动那些事（12.A）- uSDHC eMMC启动时间(RT1170)

linux安装cuda和cudnn

Mellanox网卡开启SR-IOV

模拟手机设备：使用 Playwright 实现移动端自动化测试

HTML 00 Tutorial

全面系统的AI学习路径，帮助普通人也能玩转AI

从零开始：使用 Playwright 脚本录制实现自动化测试

uni-app实现上拉加载

2020-5-18 吳恩達-改善深層NN-w1 深度學習的實用層面(1.2 偏差-欠擬合(訓練集)/方差-過擬合(驗證集))

2020-6-6 吳恩達-NN&DL-w2 NN基礎(課後編程-Logistic Regression with a Neural Network mindset)

2020-6-10 吳恩達-NN&DL-w3 淺層NN(課後作業)

2020-6-21 吳恩達-NN&DL-w4 深層NN(課後作業)

2020-5-19 吳恩達-改善深層NN-w1 深度學習的實用層面(1.4 正則化-L2正則化/弗羅貝尼烏斯範數/權重衰減)

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結