0. 寫作目的
好記性不如爛筆頭。
1. 問題
目前的 spatial pooling 都是 N*N的,這會限制他們捕捉特徵。如分佈狹長的
2. 解決方法
使用1*k 和 k * 1的pooling。
同時結合來PSPNet 中的 Pyramid Pooling。
2.1 SPM (Strip Pooling Module):來提高感受野。
2.2 MPM(Mixed Pooling Module): 來進一步對long-range 依賴進行建模
3. 實驗
3.1 SPM的使用的位置
實驗結果: 使用在最後一個stage的所有的block,以及每一個stage的最後一個block
3.2 MPM的個數實驗
最終實驗結果:使用2個MPM,使用的方式是stack。
3.3 實驗結果
從實驗的結果來看,提升幅度較小,沒有達到1%mIoU.
There may be some mistakes in this blog. So, any suggestions and comments are welcome!
注: 文中的圖來源於paper。
[Reference]
parper: https://arxiv.org/abs/2003.13328
code: https://github.com/Andrew-Qibin/SPNet