Paper Reading -- CSA-MSO3DCNN: Multiscale Octave 3D CNN with Channel and Spatial Attention

論文:CSA-MSO3DCNN: Multiscale Octave 3D CNN with Channel and Spatial Attention for Hyperspectral Image Classification

1. Motivation

提出問題:由於高光譜圖像存在空間信息冗餘的情況,所以在用3D-CNN處理高光譜圖像分類問題時會帶來大量的參數。
如何解決:作者引入OctConv替代傳統的卷積,能夠有效減少空間冗餘和增大感受野。
關於OctConv

2. Model Structure

  • Octave Convoltion
    在這裏插入圖片描述
    總體結構和OctConv原文相同,不同之處在上圖紅框。對於一個三層的OctConv,原文的最後一層是將低頻信息轉換爲高頻信息,然後和更新後的高頻信息彙總輸出;本文中是將高頻信息轉換爲低頻信息,和更新後的低頻信息彙總輸出。個人認爲作者的目的是得到尺寸更小的feature map,從而進一步減少參數和增大感受野。

  • Channel and Spatial Attention
    在這裏插入圖片描述
    又是熟悉的attention !!! 關於注意力機制就不多說了,之前的一篇博文已經總結了:https://blog.csdn.net/zxdd2018/article/details/104325588

  • 總體結構
    在這裏插入圖片描述

3. Datasets

  • Indian Pines
  • Pavia University
  • Grss_dfc_2013(NSF-funded Center for Airborne Laser Map- ping (NCALM))
  • Grss_dfc_2014( 2014 IEEE GRSS Data Fusion Contest)

數據集劃分方式:不按百分比,每類選取相同數量

4. Parameters

  • ratio(OctConv): 0 ~ 1
  • patchsize:14×14 18×18 22×22 26×26 30×30
  • dropout:0.2 0.4 0.5 0.6 0.8
  • training sample

總結

論文主要創新點:引入OctConv代替普通卷積

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章