1.空洞卷積 Atrous convolution(Dilated convolution)
kernel_size = 3*3
dialted rate 分別爲1,2,4
在不增加計算量的情況下,擴大了感受野
2.1 可變性卷積 Deformable Convolutional Networks
更一般的話的空洞卷積,進一步自適應選擇採樣方式
效果圖如下:
網絡實現如下:通過網絡自適應學習每個像素點的採樣點的偏移量,根據偏移量進行採樣然後加權求和得到feature map, 完成deformable convolution 操作。
2.2 可變性卷積 Deformable Convolution Network 2
在原有DCN的基礎上,進行改進。網絡不僅預測偏移量,同時還預測其對應幅度,當幅度爲0時,意味着不關注當前像素點區域。
3. 非對稱卷積核
出自論文《ACNet: Strengthening the Kernel Skeletons for Powerful CNN via Asymmetric Convolution Blocks》
訓練到測試模型的等價轉換包括:BN Fusion 和 Branch Fusion 兩個步驟。
4.條形池化(strip pooling)
源自論文《Strip Pooling: Rethinking Spatial Pooling for Scene Parsing》
與傳統的方形空間池化操作不同,該論文設計了條形池化思路,用於捕獲細長條物體的特徵
基於條形池化思想,設計了Strip Pooling Module 和 Mixed Pooling Module,嵌入到backbone網絡中
SPM如下圖,可以看作一種attention機制
MPM如下圖,包括傳統空間池化和條形池化兩個子模塊,分別用於捕獲短距離(局部)依賴和長距離依賴,從而更好地適應於不同形狀物體