1,computational graphs,一系列簡單的計算過程組成的一張圖,易於求導(理論指導爲鏈式法則)
a,. feedward
b,backward:前一個輸入當作未知數求導,因爲前一個輸入包含着與未知數w的關係。即
所以
- 1.37下面應該爲
−11.372=−0.53 - 將1.37視爲output,對於0.37的倒數爲1,所以0.37下面爲-0.53*1 = -0.53
- -1.00下面:-0.53*e-1 = -0.20
- 1.00下面:-0.2*-1 = 0.2
- 4.00,-3.00 下面 0.2.(加號就直接分配梯度)對w2的梯度爲0.2
- -2.00,6.00下面爲0.2
- w0的梯度爲0.2*(-1.00)= -0.2
- w1的梯度爲0.2*(-2.00 )= -0.4
全連神經網絡的bp過程:
- 數學方法:
以上圖只有一個隱層的神經網絡爲例:得到y前,輸入的softmax函數的變量用t表示。z經過activition function 後的輸出用s表示。
未知數爲權值矩陣
所以有
2,對max gate的求導:
3,向量對矩陣或向量求導
觀察可知: