論文的下載地址:https://arxiv.org/abs/1511.03339v2
論文的中心思想:將注意力機制用到多分辨率輸入的語義分割網絡中。
注意力機制其實就是對feature map做加權,且加權的權重在訓練的時候學習的。
很多語義分割網絡融合了多尺度(多分辨率)的特徵,但方法不盡相同。一種常見的結構是SPP(Spatial Pooling Pyramid),另一種方法則是使用不同分辨率的分支。不同分辨率的分支有三種,最簡單就是輸入不同分辨率的圖像然後通往不同的分支,另外兩種如下圖: