1.輸入圖片
輸入一張圖片,爲RGB三通道,像素爲32x32,記爲輸入圖像:32x32x3,3也叫深度:
2.卷積核
3.計算卷積
3.1如圖,將輸入圖片展開(將圖片周圍補0),卷積核(有兩個卷積核)也展開,圖中連線的矩陣的每一個小格子,對應相乘,再相加
3.2將3個矩陣產生的結果求和,並加上偏置項,即0+2+0+1=3,因此就得到了輸出矩陣的左上角的3:
3.3對第二個卷積核也作同樣的操作
有幾個卷積核,就出來幾個這樣的矩陣,深度就爲幾,卷積出來以後的圖叫做特徵圖
3.4 滑動,這裏滑動兩個位置,這個叫做stride,這裏stride=2
4.權值共享
所謂的權值共享就是說,給一張輸入圖片,用一個filter去掃這張圖,filter裏面的數就叫權重,這張圖每個位置是被同樣的filter掃的,所以權重是一樣的,也就是共享。
5.池化(pooling)
池化的功能就是將特徵圖進行壓縮,也是用一個卷積和去掃描,不過這次不是對應項相乘再相加,而是被卷積核掃描的區域取一個最大值,或者平均值,如圖是最大池化
6.卷積神經網絡的組成
relu層是激活層,將輸入經過一個激活函數