所有內容基於目標識別
一、開集識別
對於一個特定的識別問題,常用的識別方法是閉集識別(支持向量機分類器(SVM)、K-近鄰分類器(KNN)、最大相關係數分類器(MCC)以及自適應高斯分類器(AGC)),即假定輸入的待測樣本一定屬於已知的數據庫。
但在實際作戰環境中,測試樣本中常常含有未知樣本,如果繼續使用閉集識別系統,系統將錯誤地將來自未知類的測試樣本識別爲屬於已知閉合集類之一,正確率下降。爲解決這個問題引入開集識別。開集識別的目標識正確劃分類別且正確拒絕其他未知類別。
二、目前先進的開集識別算法
OpenMax:利用來自預訓練的深度神經網絡的倒數第二層的激活矢量。使用EVT從每個類的平均值建模這些激活矢量的距離,生成更新的倒數第二矢量(稱爲OpenMax),這個更新的矢量產生了更好的模型,用於識別未知的類測試樣本。即以前的CNN中倒數第二層使用SoftMax概率描述,但是並沒有產生開集識別的良好模型,爲適應開放式環境,更新倒數第二層矢量。
(EVT:極值理論,能夠處理小概率事件,預測極端事件的概率。本文使用EVT的原因:使用EVT建模技術對來自網絡的重構誤差分佈進行建模,從而進一步提高性能。)
G-OpenMax:該算法是將OpenMax與使用GAN生成的數據增強相結合。使用GAN從已知的類數據生成未知樣本,然後將它們用於訓練CNN以及已知類。這種數據增強技術被證明可以改善未知的類別識別。
(GAN:生成式對抗網絡是一種深度學習模型,是近年來複雜分佈上無監督學習最具前景的方法之一。模型通過框架中(至少)兩個模塊:生成模型和判別模型的互相博弈學習產生相當好的輸出。)
CROSR:訓練網絡以進行輸入數據的聯合分類和重建。這增強了學習的表示,以便保存未知和已知數據的信息,以及區分已知類別的信息。我們用於開集識別的新型分類-重建學習(CROSR),能夠在不損害已知分類準確度的情況下實現穩健的未知檢測。大量實驗表明,此方法在多個標準數據集中優於現有的深度開集分類器,並且對各種異常具有魯棒性。
三、一種的開集識別算法——MLOSR
基於CNN的深度開放式識別多任務學習——MLOSR
原理:通過將自動編碼器和分類結合起來可以有效通過多任務提高open-set的表現。
系統架構由四個模塊組成:如下圖所示
- 特徵提取器(或編碼器)
- 解碼器
- 分類器
- 極值模型(Pevt)
特徵提取器(或編碼器)網絡由CNN架構建模,該架構將輸入圖像映射到潛在空間上表示。 另一個CNN和分類器模擬的解碼器,由完全連接的神經網絡建模,將這種潛在的代表作爲輸入,並分別產生重建的圖像及其標記作爲輸出。 解碼器網絡和分類器網絡共享特徵提取器模塊。 在訓練模型F,G和C之後,使用EVT對重建誤差進行建模。訓練過程以學習參數(Θf,Θg,Θc)並使用EVT討論識別分數分析。
特徵提取器網絡獲取任何輸入圖像(X)併產生潛在表示(z)。 分類器(C)和解碼器(G)使用該潛在表示來分別預測類標籤和重建輸入(X)。 訓練這些網絡以在多任務框架中執行分類和重建任務。 使用EVT對重建誤差分佈的尾部建模。在測試期間使用分類分數和EVT重建誤差概率來執行開集識別。