caffe中卷積計算詳解

原創

XZZPPP

2020-06-29 19:55

卷積是卷積神經網絡的重要組成部分，消耗整個網絡中大量計算資源，理解卷積計算過程，對優化網絡結構和簡化網絡模型非常重要。

正常卷積的實現如下圖所示：

非常重要的是：卷積核其實和特徵圖一樣，是一個三維矩陣，這點需要注意。

上圖是一個典型的卷積過程。第一列是一個7*7*3的特徵圖；第二列是第一個卷積核，大小爲3*3*3；第三列是第二個卷積核，大小爲3*3*3；第四列得到了兩個輸出特徵圖，第一個是原特徵圖和第一個卷積核卷積得到的，第二個是原特徵圖和第二個卷積核卷積得到的。

計算：第二列的卷積核的第一個3*3模板在第一個特徵圖上進行加權迭代，得到值爲-3；第二個3*3模塊在第二個特徵圖對應位置，進行同樣的操作，得到4；第三個得到0；最後，加上偏置1，即：-3+4+0+1=2。按這樣的計算規則，卷積核在原特徵圖上進行滑動遍歷，最終得到了第四列，第一個輸出特徵圖。第三列的卷積覈計算同上，得到了第四列，第二個輸出特徵圖。

乘法次數：即進行了幾次乘法，第一個卷積核進行了(3*3)*3次乘法，兩個卷積核共2*(3*3)*3次。

參數個數：即權值個數，第一個卷積核有(3*3)*3個參數，加上一個偏置，共(3*3)*3+1=28個參數。所以，兩個卷積核共28*2=56個參數。

那麼，卷積過程，在caffe代碼中是怎麼實現的呢？如下圖所示：

上圖類似上面的卷積過程，輸入特徵圖大小爲：in_channels*in_height_*in_width,卷積核大小爲:in_channels*k_height_*k_width（注意：卷積核channels和輸入特徵圖的channels相同），輸出特徵圖大小爲：out_channels*out_height_*out_width。

caffe實現時，先將輸入特徵圖和卷積核都轉化爲矩陣，計算好了再還原，如下圖：

將輸入特徵圖中，卷積部分的那個區域中數據(原特徵圖中)，轉變爲一列，如果channels爲1，則列長爲k_height_*k_width，否則爲in_channels*k_height_*k_width。當卷積核移動一次，對應的區域數據又形成了新的一列，卷積核一用移動out_height_*out_width次，這樣輸入特徵圖矩陣的寬度就爲out_height_*out_width。所以，就形成了一個(in_channels*k_height_*k_width)*(out_height_*out_width)的矩陣。同上，得到一個(out_channles)*(in_channels*k_height_*k_width)的卷積核矩陣。
用卷積核矩陣*輸入特徵圖矩陣，得到(out_channles)*(out_height_*out_width)大小的輸出特徵圖矩陣，還原後得到out_channles個out_height_*out_width大小的特徵圖。
以上，即爲卷積計算的詳細步驟。
本博客中提到了乘法次數，當然也有加分次數，這些都是實際開發中，需要考慮的。開發中需要根據算法的浮點運算次數，來權衡選擇何種處理芯片。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

caffe中卷積計算詳解

2020年上半年數據庫系統工程師考試

小米手環2來電不震動，來電不提醒怎麼辦

caffe中卷積計算詳解

faster rcnn RPN之anchor(generate_anchors)源碼解析

Linux下如何添加附加包含目錄和依賴庫（和windows下visual studio中類比）

Windows下cmake編譯caffe，實現純C++版本MTCNN人臉檢測和關鍵點定位

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結