Going Deeper with Contextual CNN for Hyperspectral Image Classification
2017年TIP的文章。
本文主要是提出了一種新的網絡模型,深度更深,並且加上了googlenet的那種同一個層中多個scale(kernel=1,3,5)的方法,從而實現了deeper and wider。這裏主要針對的問題是現有的CNN方法做HSI分類問題中網絡結構較小較簡單從而不能達到最優結果。本文作者用一個更深的和更wide的網絡(其實就是加了個inception結構單元)來實現HSI分類。它的一個好處在於,它可以同時學習到spatial和spectral的特徵。在這個深度網絡中,用到了FCN,ResNet的結構,以及multi-scale filter,也就是inception的結構。如圖所示:
Accordingly, the reduction of the spectral dimension of the hyperspectral images is in general initially performed to fit the input data into the small-scale networks by using techniques, such as principal component analysis (PCA) [9], balanced local discriminant embedding (BLDE) [3], pairwise constraint discriminant analysis and nonnegative sparse divergence (PCDA-NSD) [10],etc.
這個PCA之類的降維操作是之前的各種方法普遍採用的預處理手段。實際上,即使是CNN方法,之前也都是用來提取spatial特徵,然後和spectral特徵合併,用來train分類器的。因此這裏作者主要提到的就是這一點,作者認爲他們的CNN可以直接同時把這兩個特徵都提取到。這也是本文的一個contribution。
The multi-scale filter bank is basically used to exploit various local spatial structures as well as local spectral correlations. 其實就是簡化版的inception。。。
測試實驗用的還是那三個開源數據集:
145×145 pixels for the Indian Pines dataset,
610×340 pixels for the University of Pavia dataset,
512×217 for the Salinas dataset
Indian pines,pavia U, Salinas。
本文號稱是第一篇用較深的網絡做這個任務的文章,並且可以同時提取spatial-spectral特徵,以及用了很多諸如inception和ResNet的結構。
網絡模型如下:
訓練方法如下圖:
對高光譜中的像素點進行隨機採樣,得到訓練集和測試集,採到的點及其5x5的鄰域構成的patch作爲輸入,對應的ground-truth作爲reference,投入到上面的網絡進行訓練。測試結果也是用這樣的多通道的小patch來做的。
另外,爲了避免過擬合,作者對patch做了水平和豎直方向及對角線方向的鏡像,從而實現了4倍率的augmentation。
實驗結果:
和基於網絡的方法相比,該文的結果達到了SOTA。
2019年03月20日21:19:44