論文閱讀:Selective Kernel Networks

這是一篇算是結構性的文章,拿來看一下

2019CVPR : SK-Net

Selective Kernel Networks 由字面意思,選擇性內核網絡,可以自適應調整核大小的網絡。

在這裏插入圖片描述
擬解決問題: 標準的CNN中,每一層的人工神經元的感受野設計爲相同的大小。但是視覺皮層神經元的感受野大小是受刺激調節的,人工構造則沒有考慮到這一點。這樣就會導致在捕捉特徵的時候無法很準確地捕捉特徵。

本文則是提出了一種動態選擇機制,允許每個神經元根據輸入信息的多個尺度自適應調整感受野的大小。設計了一種被稱爲選擇內核(SK)單元的構造塊,在該構造塊中,多個具有不同內核大小的分支使用softmax attention進行融合,並由這些分支中的信息引導。對這些分支的不同關注導致融合層神經元的有效接受野大小不同。多個SK單元被堆疊到稱爲選擇性內核網絡(SKNets)的深層網絡中。SKNet中的神經元能夠捕獲不同尺度的目標對象,驗證了神經元根據輸入自適應調整感受野大小的能力。

相關工作

這一塊梳理了一些結構性網絡的文章,如果將來有需要可以當綜述查看一下。
多分支卷積網絡

Highway networks 、shake-shake networks 、multi-residual networks 、
The deep neural decision forests 、FractalNets 、 Multilevel ResNets 、The InceptionNets

分組/切除/擴張卷積

注意力機制

動態卷積

網絡結構

我們先來回憶一下SE-Net的網絡結構:
在這裏插入圖片描述
SK-Net:
在這裏插入圖片描述

可以看到,該SK-Net由三個算子組成:Split、Fuse和Select。
Split分割算子生成不同核大小的多條路徑,對應不同的神經元感受野大小。
Fuse融合運算符結合和聚合來自多個路徑的信息,以獲得選擇權重的全局和綜合表示。
Select選擇操作符根據選擇權重將不同大小的核的特徵映射進行聚合。

具體實現

Split 分割

對於給定的特徵圖X,分別以3和5的卷積核F進行轉換,其中轉換F都是由有效的分組或者深度卷積+BN+ReLU組成。
5x5的卷積核由3x3的卷積核以擴張因子爲2進行擴張卷積。

Fuse融合

目標是使神經元能夠根據刺激內容自適應地調整他們的感受野的大小。
基本思想是使用門來控制來自多個分支的信息流,這些分支攜帶不同尺度的信息進入下一層的神經元。
1、首先將多個分支的結果通過元素級求和進行融合:
在這裏插入圖片描述
2、然後,我們簡單地使用全局平均池來嵌入全局信息,生成信道上的統計信息。
具體來說,s的第c個元素通過空間維數H×W收縮U來計算,SE模塊中的壓縮:
在這裏插入圖片描述

3、接着一個緊湊的特徵z被創建,以使精確和自適應選擇的指導成爲可能。
這是通過簡單的全連接(fc)層實現的,通過降維來提高效率:
在這裏插入圖片描述
Select 選擇

在緊湊的特徵描述 z 的引導下,使用跨通道的Soft attention 自適應地選擇不同空間尺度的信息。具體來說,在通道方向的數字上使用softmax操作符:
在這裏插入圖片描述

最終的特徵圖:
在這裏插入圖片描述

分頁

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章