深度學習之神經網絡入門(1)——神經網絡是什麼

一、快速理解神經網絡

1.神經網絡的生物定義及其在深度學習上的延伸

在生物神經網絡中,每個神經元與其他神經元相連,當它興奮時,就會向相連的神經元發送化學物質,從而改變這些神經元內的電位;如果某神經元的電位超過了一個閾值,那麼它就會激活,即興奮起來。向其他神經元發送化學物質。

最簡單的神經元模型:M-P神經元模型

 

                圖1

 

由此圖可以產生多種理解,最爲廣泛且推薦的理解是將其理解爲複合函數

例:神經元接受輸入x,通過帶權重w的連接進行傳遞,將總輸入信號與神經元的閾值進行比較,最後通過激活函數處理確定其是否得到激活。

 

對牽扯到的幾個定義進行解釋:

a.神經元模型

神經元模型是簡單單元,圖1所示即爲神經元模型

b.閾值

閾值,即bias,算式中可將閾值看作固定輸入爲-1的啞節點對應的連接權重。

c.激活函數

Sigmoid(圖2),Relu(圖3),Tanh(圖4)函數是我們常用的激活函數,而理想中的激活函數是階躍函數(圖5

                                           圖2

                                               圖3

                                                         圖4

                                                    圖5

在之後的文章中會對激活函數進行詳細深入的介紹

 

 

2.深度學習中的神經網絡

神經網絡是由具有適應性的簡單單元組成的廣泛並行互連的網絡,它的組織能夠模擬生物神經系統對真實世界物體所做出的交互反應。

 

                         圖6

 

圖6是一個略顯複雜的神經網絡,每一個圓圈都是一個神經元,每條線表示神經元之間的連接。神經網絡有一個顯著的特徵:層與層之間的神經元有連接,而層內的神經元沒有連接。最左邊的叫做輸入層,最右邊的是輸出層,兩者之間的層叫做隱藏層。

給出相應層的作用:

(a).輸入層:負責接收輸入數據

(b).輸出層:獲取神經網絡輸出數據

(c).隱藏層: 隱藏層比較多(大於2)的神經網絡叫做深度神經網絡。而深度學習,就是使用深層架構(比如,深度神經網絡)的機器學習方法。

 

3.神經元的深層次定義

神經網絡的組成單元——神經元,也叫做感知器(如圖7)

                                圖7

可以發現,感知器與M-P神經元模型(圖1)十分相似

一個感知器有如下組成部分:

(a).輸入權值:一個感知器可以接收多個輸入,每個輸入上有一個權值,此外還有一個偏置項(如上圖中的w0)

(b).激活函數:最簡易的選取爲階躍函數

(c).輸出:感知器的輸出由相應的公式進行計算   y=f(w*x+b)

 

感知器還有更爲深入的應用,在此後的文章中會深入分析

 

4.優化算法與最優解

神經網絡學習的過程,其實就是根據訓練數據,來調整神經元之間的連接權w以及每個功能神經元閾值b的過程。 而神經網絡的訓練過程即是一個參數尋優過程,基於梯度下降求得的可能是局部最優但不一定是全局最優解。只有通過多次的模型試驗,才能得到更好的模型。

 

此部分爲神經網絡的主要部分,在這隻做一個簡介,詳見後續文章。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章