1、代價函數（Cost function）

令k爲輸出層的個數，當k>=3時，使用多元表達。所以，神經網絡的代價函數一般形式，需要對k個輸出求和，如下

注意到正則化項，由j=1開始，因爲類似 $x_0$ 之類的項，通常都不做正則化。

2、選擇神經網絡框架

1、輸入和輸出都是確定的。
2、一般採用一個隱藏層，如果有多個隱藏層，其維度一般一樣多。
3、隱藏單元和隱藏層越多越好，但是計算量變大。

3、隨機初始化

隨機初始化權重，不能爲了0，也不能一樣。
比如一般可以使用在0附近正態分佈的值 $\mathcal{N}(0,0.1)$
在實踐中，會有一種比隨機值初始化更好的方法。叫做Xavier/He 初始化，對權重(weights)進行的初始化如下

4、前向傳播（forward propagation）

1、從左至右，一步一步，計算所有 $h_{\Theta}(x^{(i)}$
2、計算代價函數 $J(\Theta)$ n

5、反向傳播（back propagation）

由前面計算的 $h_{\Theta}(x^{(i)}$ ，與 $y^{(i)}$ 之間的差誤差 $\delta^{(i)}$
然後一步一步從右往左反向計算所有的 $\delta$ ： $\delta^{(3)}$ 、 $\delta^{(2)}$ ，不計算 $\delta^{(1)}$

$\delta^{(4)}=a^{(4)}-y$
$\delta^{(3)}=(\Theta^{(3)})\delta^{(4)}. *g'(z^{(3)})$ 其中 $g'(z^{(3)})=a^{(3)}. *(1-a^{(3)})$
$\delta^{(2)}=(\Theta^{(2)})\delta^{(3)}. *g'(z^{(2)})$ 其中 $g'(z^{(2)})=a^{(2)}. *(1-a^{(2)})$

而， $\frac{\partial }{\partial \Theta_ij^{(l)}}J(\Theta)=a_j^{(l)}\delta_i^{(l+1)}$
寫成向量的形式是：
例如： $\frac{\partial }{\partial \Theta^{(4)}}J(\Theta)=a^{(3)}\delta^{(4)}=(a^{(4)}-y)(a^{(3)})^T$

6、梯度檢測

第一次計算出偏導數（梯度）之後，要對計算值進行驗算，驗證算法是否正確。
通過對 $\theta$ 增加微小量 $\epsilon$ 進行近似。

驗證之後，記得將驗證算法關閉。

7、優化

例如使用梯度下降算法（或其他算法），對權重進行優化。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

數據挖掘day28、29-CS229-WEEK4 Neural Networks:Learning

1、代價函數（Cost function）

2、選擇神經網絡框架

3、隨機初始化

4、前向傳播（forward propagation）

5、反向傳播（back propagation）

6、梯度檢測

7、優化

1082. Sales Analysis I 難度：簡單

數據挖掘day22、23-《數據挖掘導論》-第四章，4.1-4.3.7 決策樹

01、（golang）FIFO循環隊列

百家號爬蟲（獲取各領域創作者appid）

數據分析工具彙總

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結