論文:CSA-MSO3DCNN: Multiscale Octave 3D CNN with Channel and Spatial Attention for Hyperspectral Image Classification
1. Motivation
提出問題:由於高光譜圖像存在空間信息冗餘的情況,所以在用3D-CNN處理高光譜圖像分類問題時會帶來大量的參數。
如何解決:作者引入OctConv替代傳統的卷積,能夠有效減少空間冗餘和增大感受野。
關於OctConv
2. Model Structure
-
Octave Convoltion
總體結構和OctConv原文相同,不同之處在上圖紅框。對於一個三層的OctConv,原文的最後一層是將低頻信息轉換爲高頻信息,然後和更新後的高頻信息彙總輸出;本文中是將高頻信息轉換爲低頻信息,和更新後的低頻信息彙總輸出。個人認爲作者的目的是得到尺寸更小的feature map,從而進一步減少參數和增大感受野。 -
Channel and Spatial Attention
又是熟悉的attention !!! 關於注意力機制就不多說了,之前的一篇博文已經總結了:https://blog.csdn.net/zxdd2018/article/details/104325588 -
總體結構
3. Datasets
- Indian Pines
- Pavia University
- Grss_dfc_2013(NSF-funded Center for Airborne Laser Map- ping (NCALM))
- Grss_dfc_2014( 2014 IEEE GRSS Data Fusion Contest)
數據集劃分方式:不按百分比,每類選取相同數量
4. Parameters
- ratio(OctConv): 0 ~ 1
- patchsize:14×14 18×18 22×22 26×26 30×30
- dropout:0.2 0.4 0.5 0.6 0.8
- training sample
總結
論文主要創新點:引入OctConv代替普通卷積