論文解讀——High-Resolution PolSAR Scene Classification With Pretrained Deep Convnets

原文:'High-Resolution PolSAR Scene Classification With Pretrained Deep Convnets and Manifold Polarimetric Parameters'.


摘要:在PolSAR數據分析中,如何聯合使用空間和極化信息一直以來都是一個開放的話題。受益於先進的結構和大規模可視化數據集,深度卷積神經網路能夠生成高層空間特徵,在圖像分析領域獲得當前最好的性能。然而,由於PolSAR數據不僅是多個通道夫人,而且還是複數值,所以現有的CNN模型無法輕易用來處理PolSAR數據。爲了解決這個問題,我們發展了新的數據集來探索CNN在PolSAR場景分類中的潛能。我們發現這些CNN模型在每一層學習固定的語義信息,並且通過改變中層的濾波器來適應不同的數據類型。對於PolSAR數據,卷積濾波器傾向於在分離的顏色生成特徵(這種特性使得網絡可以區分不同的極化機制),而不是檢測顏色模式。因此,本文提出一種集成的遷移學習框架,把流行極化分解融入到DCNN中,同時保留預先學習到的空間分析能力。不同的極化參數能夠反映對不同目標的極化機制,引進新的判別特徵來提高目標識別力。所提出的框架獲得了99.5%的驗證準確率,並且可能有益於PolSAR數據的廣泛應用。

1. 引言

在過去的幾年中,深度學習已經成爲計算機科學領域最流行的一種技術,它有時能夠以某種方式解決人類無法理解的複雜性問題。深度學習仍然在快速發展中,但是它的潛能不容易理解。深度學習幾乎滲透到包括遙感在內的每一個領域。PolSAR是遙感領域的一個重要分支。SAR不受天氣日照的影響,可以採集全空間和時間圖像序列而不被雲層所幹擾,這種特性不僅對於諸如災難監測等實時的應用非常關鍵,而且比光學傳感器更適合於時間序列的分析。在SAR應用中,圖像解譯主要依賴於極化特性逐像素點的PolSAR參數通常被採用,但是空間特徵的使用是非常缺乏的,而這種空間特性可以揭示高分辨率圖像中所包含的豐富信息。高分辨率的SAR圖像不僅受到相干斑噪聲的影響,而且還會包含不連續的人工建築結構。此外,極化散射嚴重依賴於視角,角度的微小變化都會改變極化機制。例如不同的建築會有不同的散射機制。這些問題使得傳統的機器學習方法和手工的特徵失效,從而嚴重限制了PolSAR數據的應用

深度卷積神經網絡能夠獲得高層的複雜空間模式,這種特性使得CNN在圖像解譯中得到廣泛應用。先進的CNN模型在計算機視覺領域具有較強的競爭力,諸如ResNets、DenseNets等含有上百個層和百萬個可訓練參數的模型。訓練這些大型網絡,我們需要大量的樣本。但是截至目前,大部分遙感數據的樣本是有限的,在這種情況下我們推薦遷移學習。所謂遷移學習,就是使用一個網絡預先學習到的知識來解決一個新問題。當訓練樣本有限時,這種方法尤其有效。使用遷移學習的方法,網絡在預先訓練好的權值的基礎上更新參數,比從頭開始訓練學習得更快。自從2015年以來,使用光學圖像預訓練好的CNN模型已經被遷移過來學習光學遙感圖像。但是,這種思想不能簡單地借鑑過來應用於PolSAR數據,因爲PolSAR數據不僅是多通道的,而且還屬於複數域。使用光學圖像預訓練的DCNN只能考慮後向散射密度,而極化相位會被完全忽略

已有工作:

zhou等人先是引入了6通道的DCNN,使用協方差作爲輸入;而後又提出CV-CNN來充分利用極化信息,這種網絡的權值和輸入都是複數域的。

在這篇文章中,我們通過回答以下問題來認知深度學習在PolSAR處理中的潛能:

1)CNN是如何建立對PolSAR數據理解的?

2)我們如何聯合地把極化信息和高層次空間特徵應用於PolSAR數據分析中?

與農作物分類和建築區檢測等簡單問題相比,我們考慮的是一個更具挑戰性的問題——場景分類。場景分類是高分辨率遙感圖像分析的一個關鍵問題,也是語義分割、目標檢測、圖像標註等其他高級應用的重要基礎

由於具有較高的空間分辨率,一個場景中可能會包含多種表面變化多樣的目標,而不同的場景中可能具有相似的目標。此外,每一種地面目標可能會以變化的位置隨機分佈於場景中,使得對地面目標的判別更困難

2. 新的高分辨率極化數據集

用於場景分類的高分辨率PolSAR數據集是非常少的,因爲PolSAR數據源通常是商業化且昂貴的。

新的數據集中每個樣本由四組參數表示,包括以下信息:

1)S矩陣的幅度(3維-data set 1)只考慮了極化散射密度。

2)三種高級的極化參數:

    a)最原始的極化描述(9維):協方差矩陣C的9個元素的實部。

    b)基於特徵值的特徵分解(3維):H-A-α

    c)非相干的極化分解(3維):Yamaguchi分解:奇次散射、偶次散射、體散射

使用S矩陣的密度表示原始的自然森林、植被和溼地時,它們看起來比較相似,但是用極化參數表示時可以明顯把它們區分開來

3. 探索DCNNs在PolSAR場景分類中的應用

3.1 基於極化後向散射幅度和三種在ImageNet上預訓練的CNN模型的場景分類

爲了檢驗CNN模型是否能夠有效地從高分辨率的PolSAR圖像中生成空間特徵,我們使用三個經典的在imageNet數據集上預先訓練好的模型對data set 1進行分類。

1)VGG-16:

2)ResNet-50:在遙感領域最受歡迎的網絡模型

3)DenseNet-121:在計算機視覺的各領域取得最好的性能。但是因爲遙感數據量很小,所以選擇網絡模型的時候應該選擇小規模或者中等規模的網絡。

基於CNN的像素點分類會有大量的冗餘——使用FCN

在遷移學習中,我們代替最後的softmax層,其輸出個數換成了本實驗數據集對應的種類數,我們使用一個較小的學習率對網絡進行微調,以便保留預先學習到的知識。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章