0. 写作目的
好记性不如烂笔头。
1. 问题
目前的 spatial pooling 都是 N*N的,这会限制他们捕捉特征。如分布狭长的
2. 解决方法
使用1*k 和 k * 1的pooling。
同时结合来PSPNet 中的 Pyramid Pooling。
2.1 SPM (Strip Pooling Module):来提高感受野。
2.2 MPM(Mixed Pooling Module): 来进一步对long-range 依赖进行建模
3. 实验
3.1 SPM的使用的位置
实验结果: 使用在最后一个stage的所有的block,以及每一个stage的最后一个block
3.2 MPM的个数实验
最终实验结果:使用2个MPM,使用的方式是stack。
3.3 实验结果
从实验的结果来看,提升幅度较小,没有达到1%mIoU.
There may be some mistakes in this blog. So, any suggestions and comments are welcome!
注: 文中的图来源于paper。
[Reference]
parper: https://arxiv.org/abs/2003.13328
code: https://github.com/Andrew-Qibin/SPNet