基於深度學習的遙感圖像分類總概

轉載https://blog.csdn.net/qq_40116035/article/details/81414835

  傳統的分類方法分兩種:監督分類和非監督分類。監督分類要求對所要分類的地區必須要有先驗的類別知識,即先要從所研究地區中選擇出所有要區分的各類地物的訓練區,用於建立判別函數。常用的監督分類方法有:K近鄰法、馬氏距離分類、最大似然法等方法。監督分類方法主要有:均值、方法等。研究者對非監督分類產生的類別較難控制監督分類,結果通常不理想。

    近年來,分類方法逐漸向機器學習的方向發展。傳統機器學習方法,如Smolensky的受限玻爾茲曼機(Restricted Boltzmann Machine, RBM)[2]、Olshausen和Field的稀疏編碼(Sparse Coding, SC[3])等,大都使用淺層結構,處理有限數量的樣本。當目標對象具有豐富含義時,基於這些淺層結構學習到的特徵表達,在處理複雜的分類問題時,表現性能及泛化能力均有明顯不足。2006年,Hinton等[4]基於人腦學習的思想提出了一種深度神經網絡的機器學習方法。深度神經網絡(Deep Neural Network,DNN)也稱深度學習(Deep Learning),已成爲一種從海量圖像數據中直接學習圖像特徵表達的強大框架。從計算機視覺的角度提取遙感圖像信息,能夠極大地提高含有大量未知信息的遙感圖像分類的精度。因此,深度學習成爲遙感圖像分類研究中的熱點。

深度學習典型方法和遙感應用

    深度學習具有特徵學習和深層結構兩個特點,有利於遙感圖像分類精度的提升。特徵學習能夠根據不同的應用自動從海量數據中學習到所需的高級特徵表示,更能表達數據的內在信息。深層結構通常擁有多層的隱層節點,包含更多的非線性變換,使得擬合複雜模型的能力大大增強。遙感圖像中深度學習分類算法主要可以分監督學習和非監督學習(見圖1)。本文將對DBN、CNN、SAE三種典型的深度學習方法進行論述,並分析上述方法在遙感圖像分類中的應用現狀。

 

2.1深度置信網絡(DBN)

    深度置信網絡(Deep Boltzmann Machine,DBM)是受限玻爾茲曼機(Restricted Boltz Mann machine,RBM)的一種改進網絡。RBM是由玻爾茲曼機(Boltz Mann machine,BM)簡化而來。

BM屬於無監督學習(見圖2),其參數空間的每種情況都通過能量函數這一映射法則指向能量域中的一個能量。RBM是一種狀態隨機的網絡模型(見圖3),單層內的各單元間無連接,而層間的單元全連接。

雖然RBM能夠很好地解析複雜數據,但是對於複雜度更高的數據或需要更深層次的解析時,需要引入多層次的網絡模型,即深度置信網(DBN)。DBN由多層的RBM和一層分類器組成(見圖4)。其訓練過程分爲兩步.第一步是對DBN進行網絡預訓練,對每層的RBM進行無監督學習;第二步是監督學習網絡調整。對無監督學習階段得到的特徵信息進行總結、歸納、取捨,最後達到一個較好的識別水平。

 

圖4  深度置信網(DBN)

    目前深度信念網絡(DBN)應用遙感數據主要有高光譜遙感、合成孔徑側視雷達、高分辨率遙感,但主要是經典數據集,需要進一步拓展不同遙感數據應用、不同行業應用。呂啓等[8]利用深度信念網絡應用於極化合成孔徑雷達圖像分類中,當層數爲3、各隱含層節點數爲64時,總體分類精度最高,達到77%,好於支持向量機與傳統神經網絡方法。劉大偉[9]採用深度信念網絡(DBN)採用光譜-紋理特徵對美國佐治亞州亞特蘭市北部一住宅小區的高分辨率影像6種地類進行分類。鄧磊等[13]利用深度信念網絡解決了極化SAR圖像分類中存在海量特徵利用率低、特徵選取主觀性強的問題。方法首先進行海量分類特徵提取,獲得極化類、輻射類、空間類和子孔徑類四類特徵構成的特徵集;然後在特徵集基礎上選取樣本並構建特徵矢量,用以輸入到深度置信網絡模型之中;最後利用深度置信網絡的方法對海量分類特徵進行逐層學習抽象,獲得有效的分類特徵進行分類。採用AIRSAR數據進行實驗,分類結果精度達到91.06%。通過與經典Wishart監督分類、邏輯迴歸分類方法對比,表現了深度置信網絡方法在特徵學習方面的突出優勢,驗證了方法的適用性。

2.2深度自動編碼(SAE)

    深度自編碼器(Stacked Auto-Encoder, SAE)是改進的自動編碼器(Auto-Encoder, AE)。

    AE是由編碼器和解碼器兩部分組成。編碼器將輸入數據映射到特徵空間,解碼器將特徵映射回數據空間,完成對輸入數據的重建。通過最小化重建誤差的約束,學習從輸入到特徵空間的映射關係。爲避免輸入簡單複製爲重建後的輸出,對AE增加一定的約束條件可變換爲不同的形式。

    SAE是由AE逐層疊加而成的,它通過對觀測數據進行編碼、解碼特徵表達,來獲得簡潔而有效的特徵,並深度捕獲隱藏在數據內部的規則;爲充分利用數據類別、模式等隱含信息,同樣要對其模型參數進行監督的微調。Liu等[5]構建了wac DAE(小波深度自動編碼器)對光學遙感圖像進行山崩自然災害分類研究,該網絡先進行小波變換和去噪等預處理,包含1個輸入層、2層隱藏層和1層輸出層,隱藏層節點數固定爲100。700張遙感圖像作爲訓練集500張遙感圖像作爲測試集。實驗結果表明,wac DAE有利於山崩識別。邢晨[14]利用自編碼器的深度學習網絡模型對高光譜遙感圖像進行分類。王巧玉[15]採用海量的未標記樣本對網絡進行無監督的訓練,從而提取數據深層、抽象的特徵信息;再將堆棧降噪自編碼器與Soft max分類器組合以形成一個深層分類網絡,採用有標記的樣本對網絡進行微調。

2.3卷積神經網絡(CNN)

    卷積神經網絡(CNN)是通過模仿生物視覺的處理過程而構建的多階段Hubel-Wiesel

結構。CNN的實質是輸入到輸出的映射關係。在學習之前,輸入和輸出之間沒有明確的數學模型,CNN通過學習大量的輸入與輸出之間的映射,對卷積網絡加以訓練,從而建立模型。

2.3.1卷積神經網絡內容

    CNN的基本網絡結構由輸入層、卷積層(convolutional layer)、池化層(pooling layer,也稱取樣層)、全連接層及輸出層構成。其中卷積層、池化層、全連接層有不同的功能。

    (1)卷積層。卷積層由多個特徵面(Feature Map)組成,每個特徵面由多個神經元組成,它的每一個神經元通過卷積核與上一層特徵面的局部區域相連。卷積核是n×n的矩陣。首先從圖像中隨機選取一小塊局域作爲訓練樣本,從該小塊樣本中學習到一些特徵,然後將這些特徵作爲濾波器,與原始整個圖像作卷積運算,從而得到原始圖像中任一位置上的不同特徵的激活值。在CNN結構中,深度越深、特徵面數目越多。但並不是深度越深越好,在實際應用中應適當選取網絡深度、特徵面數目來實現CNN的應用。

    (2)池化層。池化層在卷積層之後。卷積層是池化層的輸入層,卷積層的一個特徵面與池化層中的一個特徵面唯一對應,且池化層的神經元也與其輸入層的局部接受域相連,不同神經元局部接受域不重疊。卷積層和池化層交替設置。如果選擇圖像中的連續範圍作爲池化區域,同時只對相同的隱含神經元產生的卷積特徵使用池化,則這些池化後的特徵單元具有平移不變性。即使原始圖像中的物體產生了一個較小的平移,依然 可以得到相同的池化特徵,分類器也依然能夠輸出相同的分類結果。

    (3)全連接層。在CNN結構中,經多個卷積層和池化層後,連接着1個或1個以上的全連接層。全連接層可以整合卷積層或者池化層中具有類別區分性的局部信息。爲了提升CNN網絡性能,全連接層每個神經元的激勵函數一般採用ReLU函數。最後一層全連接層的輸出值被傳遞給一個輸出層,可以採用soft max邏輯迴歸(soft max regression)進行分類。對於一個具體的分類任務,選擇一個合適的損失函數是十分重要的。

2.3.2卷積神經網絡的優化

    自AlexNet提出後,深度學習領域的研究發展極其迅速,基本上每年甚至每幾個月都會出現新一代的技術。新的技術往往伴隨着新的網絡結構,更深的網絡的訓練方法等,並在圖像識別等領域不斷創造新的準確率記錄。卷積神經網絡改進與優化的主要模型分別包括AlexNet、VGG、GoogleNet、ResNet等,採取技術不斷優化,網絡深度擴大,Top-5錯誤率在減少。

    lexNet是一個8層的卷積神經網絡,前5層是卷積層,後3層爲全連接層,其中最後一層採用softmax進行分類。該模型採用Rectified linear units(ReLU)來取代傳統的Sigmoid和tanh函數作爲神經元的非線性激活函數,並提出了Dropout方法來減輕過擬合問題。

    Google Net首次出現在ILSVRC 2014的比賽中(和VGGNet同年),就以較大優勢取得了第一名。那屆比賽中的Inception Net通常被稱爲Inception V1,它最大的特點是控制了計算量和參數量的同時,獲得了非常好的分類性能——Top-5錯誤率6.67%,只有AlexNet的一半不到。Inception V1有22層深,比AlexNet的8層或者VGGNet的19層還要更深。但其計算量只有15億次浮點運算,同時只有500萬的參數量,僅爲AlexNet參數量(6000萬)的1/12,卻可以達到遠勝於AlexNet的準確率,可以說是優秀並且非常實用的模型。

    在2015年年底揭曉的ImageNet計算機視覺識別挑戰賽ILSVRC 2015的結果中,來自微軟亞洲研究院團隊所提出的深達152層的深層殘差網絡(ResNet)以絕對優勢獲得圖像檢測、圖像分類和圖像定位3個項目的冠軍,其中在圖像分類的數據集上取得了3.57%的錯誤率。同年Long等提出的用於圖像語義分割的全卷積神經網絡(fully convolu- tional neural net-works,FCN)[16]開闢來圖像分割的新領域。該網絡所有層都是卷積層,並採取反捲積操作,將低分辨率圖片進行上採樣,生成同分辨率的分割圖片。2016年,Dai等提出區域全卷積神經網絡(R-FCN)[17]。

2.3.3CNN在遙感圖像分類領域應用

    CNN對卷積核參數的學習訓練是通過梯度反向傳播算法實現的,該算法是一種有監督學習算法。其同一平面上的神經元權值相等,能夠並行學習、高效率地處理遙感圖像。杜敬[10]利用最大穩定極值區域對無人機遙感影像進行影像分割得到識別目標子區,然後採用共7層CNN模型(1層輸入層、2層卷積層、2層採樣層、1層全連接層、1層輸出層)對水體進行識別,識別率達到95.36%。吳正文[18]研究了卷積神經網絡的網絡結構設計和參數優化對於圖像分類的一般性規律。曹林林等[19]建立的卷積神經網絡模型應用於昆明城區2007年高分辨率遙感圖像(Quickbird)地表7種類型劃分,總體精確達98.21%,降低了因圖像平移、比例縮放、傾斜或者其他形式的變形而引起的誤差。

存在問題與建議

    基於深度學習對遙感圖像分類在準確性、實用性、通用性等方面離大規模實際應用的要求還有一定差距。主要問題有算法自身問題、遙感圖像引發的問題和應用上出現的問題三大類,下面本文將針對這些問題給出一些建議。

3.1算法自身的問題和建議

 3.1.1 參數多

    卷積神經網絡的參數衆多,但是目前的相關設置大多基於經驗和實踐,參數的量化分析與研究是卷積神經網絡的一個有待解決的問題。深度學習中典型方法在遙感領域應用有初步成果,需要利用現有成果進行遙感圖像處理規範建設。例如,如何均值處理、歸一化來進行遙感數據規範。

3.1.2 網絡結構

目前的趨勢是網絡越深,卷積神經網絡的測試效果越好,部分網絡甚至深達上千層。隨着網絡的加深,過擬合和網絡退化問題顯得更加嚴重。相比於人和其他動物的視覺機理,傳輸過程也不可能高達數百層。卷積神經網絡需要優化結構設計,尋找更高效的神經元和結構單元。對人腦功能的模擬程度不完善。現有的深度學習技術模仿了人腦的層次結構和稀疏性,但模擬化程度不高。對大腦視覺皮層稀疏響應這種非常經濟的響應機制的模擬程度不夠。

3.2遙感圖像特徵的應用問題和解決

 3.2.1 降維問題

    高光譜圖像有很大的數據量,並且數據的維數通常很高,因爲高維數所產生的信息冗餘,導致高光譜遙感圖像豐富的信息難以被有效利用。單一的降維方式已經不能滿足遙感圖像的需求,需要探索更適合高光譜遙感圖像的分類算法。

3.2.2遙感數據樣本

    在實際應用中,遙感圖像的數據的採集和標定是較困難的,獲取的已標定的訓練樣本集較小,因此在選取深度學習網絡時需要合理的考慮遙感圖像的特點,選取適合小樣本、高維數據分析的網絡模型。卷積神經網絡需要動輒百萬級的訓練樣本,卷積神經網絡對百萬級樣本訓練過程也極爲漫長,如何從小量的數據中生成良好的神經網絡將是未來的研究方向。例如目前深度信念網絡(DBN)應用主要用經典數據集,進一步拓展不同遙感數據應用,可以選擇小樣本構建的方法。

   此外遷移學習也可以解決遙感數據樣本少的問題。在髙光譜遙感數據中,通常不同時間段拍攝的數據的光譜分佈會有所不同,遷移學習則只利用有標籤的時間段的數據,對無標籤的其他時間段的數據進行分類,大大提高了數據的可利用性,節省了對所有數據標籤的人力物力。

3.2.3遙感圖像分辨率問題

    高光譜圖像其空間分辨率較低,其某些像元可能存在混合像元的現象,導致高光譜遙感圖像中不同地物的像元信息不一定具有較大的區分度,且由於採集過程的失誤也會產生相同地物的像元信息不一致性的特點。因此可以考慮一些非線性變換的方法提取其光譜特徵,以及可以考慮加入直接的光譜特徵,例如光譜吸收特徵、光譜吸收指數及導數光譜等。

3.2.4遙感圖像特徵沒有充分利用

    遙感圖像涵蓋的紋理特徵、光譜特徵和空間特徵都可以單獨作爲圖像分類的依據,然而圖像的這些特徵信息在圖像分類時尚未充分利用。對提取的這3類特徵進行多角度充分利用,並將其共同作爲分類依據,結合深度神經網絡的訓練模型,來提高遙感圖像的分類精度,成爲了該領域目前的研究熱點。

3.3模型實際應用問題和建議

3.3. 1計算速度

    遙感大數據內部的複雜高階統計特性需要高容量的深度模型來深度發掘。對應海量數據,還需要提供更高速的硬件,如多GPU混合異構的並行計算體系結構等。隨着網絡層次的加深,存儲空間的需求也更大,算法並行化加速處理以及網絡壓縮也是今後研究的重點方向。對於遙感影像可採用圖像分塊等數據並行處理技術提升算法運行速度。對於遙感影像算法,則可進一步考慮算法的任務並行性,合理設置任務並行粒度進行算法設計。

3.3.2算法應用問題

    遙感圖像分類將有利於減災應急、交通監管、漁業海事,乃至無人機和機器人等民用系統智能化水平的核心技術發展;如何利用深度學習進行遙感圖像動態監測,如何應用綜合網絡於不同遙感圖像融合並提高識別精度,值得進一步研究。

4關鍵技術和解決方案

4.1結合非監督方法降維

    針對高光譜圖像數據的維數高的問題,提出適合高光譜遙感圖像的降維分類算法。可以考慮結合非監督分類的方法,如K-means等聚類方法,先進行聚類再進行各個類別降維提取特徵分類的方法。例如基於MFCM和KPCA的多光譜圖像特徵提取方法。結合遙感數據的特點,對KPCA方法的輸入數據方法進行了改進,先用MFCM方法對原始數據進行聚類,然後將獲得的聚類中心作爲輸入樣本,提取多光譜圖像的非線性的特徵,消除圖像間存在的高階相關性。

4.2遷移學習解決樣本問題

    現在深度網絡的訓練不僅需要大量的標籤數據,並且需要很久的時間來訓練。網絡的訓練需要更加有效地利用無標籤數據,相信也是今後的研充重點。而與遷移學習的結合是利用無標籤數據的一個很好的方向。

    不同時間段、不同角度拍攝的遙感數據的會有所不同,遷移學習可只利用有標籤的部分的數據,對無標籤的其他時間段的數據進行分類。將兩個不同分佈的數據變換到相同的特徵空間中,即可用其中一種分佈的數據作爲訓練數據,對另一種分佈的數據進行分類,整個操作也可在這個相同的特徵空間中進行。這也是遷移學習要發展的方向。

    例如多時相高光譜遙感圖像分類問題,在優化的多層感知器算法中,加入源域數據和目標域數據的類心對齊策略,通過深度學習網絡對兩個域數據做非線性變換,達到變換後兩個域數據特徵相似的目的,從而使得網絡具有遷移學習的能力。

4.3利用遙感圖像空間特徵

    針對遙感圖像空間結構特徵等被忽略的問題。可以在數據訓練樣本集中採用組合鄰域光譜矢量的方式,將所有訓練樣本的鄰域信息考慮進去,使得在提取特徵的過程中即能夠獲取樣本的光譜特徵,也能夠融入其空間結構特徵,實現數據融合。

    也可以考慮構造融合空間信息的分類器。例如在分類遙感圖像時,使用高光譜圖像的像元矢量作爲網絡的訓練樣本後,採用構造融合空間信息的分類器進行分類。可以提高了高光譜遙感圖像的分類精度。

結論和展望

    本文首先介紹了遙感圖像分類中的深度學習原理,然後對遙感圖像分類在深度學習方面應用研究現狀做出闡述,並分析了其中存在的問題。根據問題提出瞭解決辦法和關鍵技術。最後總結了深度神經網絡對遙感圖像分類的發展趨勢。

    目前遙感圖像的時間分辨率和空間分辨率的不斷提升,併產生大量的多尺度遙感影像。遙感圖像分類是分析遙感數據的重要手段。

    未來,在森林防火、軍事戰略、交通管理等方面,建立基於深度學習對多尺度遙感影像圖像分類的模型將是一個發展方向。在實時交通、無人駕駛等方面,需要及時的進行遙感圖像獲取和圖像分類。基於任務的端到端卷積神經網絡的設計(如:Faster R-CNN,FCN等)有助於提升網絡的實時性,是目前的發展趨勢之一。提高海量數據的訓練速度和效率以及加快發展更高速的硬件也是研究的重點。

深度神經網絡爲遙感圖像分類開闢了一片新天地。提高了精確制導、武器防禦、海情監控等軍事系統和減災應急、交通監管、漁業海事等民用系統智能化水平。基於深度學習的遙感影像圖像分類對大量未標記的遙感圖像數據分類,將對遙感圖像分類的深入發展做出更大的貢獻。

 

參考文獻

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章