Partial Transfer Learning with Selective Adversarial
Networks
摘要:對抗學習應用於深度網絡中學習可遷移的特徵初有成效,它降低了源域及目標域之間的分佈差異。目前已有的對抗網絡假設源域和目標域共享全部的標記空間。在遷移過程中,源域中類別往往很多,而目標域通常只和源域其中一小部分相關,直接遷移肯定會產生負遷移的影響。論文提出了部分遷移學習,減輕了標記空間的約束,目標域標記空間可以僅是源域的子集。論文提出的網絡稱爲選擇性對抗網絡(SAN),通過挑選出源域中outlier類減輕負遷移影響,並在共享的標記空間中最大化匹配數據分佈提升正遷移的影響。
從大數據的角度來看,可以假設源域中大規模訓練集包含了目標域的所有類別,目標域的label僅是源域的子集,如圖1所示,源域中的outlier(‘sofa’)將產生負遷移。
方法描述
部分遷移學習目標域標記空間是源域標記空間的子集,,實際應用中也是經常由大數據集(如ImageNet)向小數據集(CIFAR10)遷移。假設源域包含類共個樣本,目標域包含類共個未標記的樣本。源域和目標域的採樣概率分別爲p和q,遷移學習中,部分遷移學習。本文的目標是設計網絡學習遷移特徵及自適應分類器建立跨域差異的橋樑,通過源域的監督學習最小化目標風險:
遷移學習中,主要的挑戰是目標域沒有標記數據,由於分佈差異,源域中學習到的分類器不能直接用於目標域。在部分遷移學習中,源域中哪部分的label與目標域共享也不知道。一方面,源域中屬於outlier的標記數據將導致負遷移;另一方面,降低t與q間的分佈差異在知識遷移中比較關鍵。
- 域對抗網絡
對抗學習是雙人遊戲,其中一個是域分辨器,用於分辨源域和目標域,另外一個是特徵提取器,目的是迷惑域分辨器。
爲提取域不變的特徵f,特徵提取器的參數θf通過最大化域分辨器Gd的損失學習,域分辨器的參數通過最小化域分辨器的損失學習,同時最小化label預測器的損失。域對抗網絡的目標函數爲:
(1)
收斂時,網絡參數滿足:
(2)
對於標準遷移學習,源域與目標域標記空間相同的情況,域對抗網絡性能較好。
- 選擇性對抗網絡
目標域標記空間是源域的子集,outlier label空間越大,負遷移情況越嚴重,論文將outlier的源域類別選出去解決負遷移問題。
爲匹配具有不同標記空間的域,將域分辨器分離成個類別級域分辨器,k=1,…,Cs,每個負責label爲k的源域和目標域數據匹配,如圖2所示。由於目標域標記在訓練中不可訪問,決定哪個域分辨器對每個目標域數據負責並不容易。而label預測器的輸出是源域標記空間的概率分佈,該分佈描述了該分爲中的哪一類。可以使用作爲將分配給某個域分辨器,的概率。這樣生成概率加權的域分辨損失:
(3)
其中是第k個域分辨器,是交叉熵損失,是xi的域標記。多分辨器域對抗網絡可以進行細粒度的自適應,每個數據僅與相關的域分辨器匹配。
同時降低源域中outlier類的域分辨器,對域分辨器進行類別級的加權:
(4)
其中,是k類的類別級權值,對於outlier類別來說很小。
多域分辨器對概率依賴程序比較高,使用熵最小化準則調整類別預測器,使得類間低密度分離,通過最小化概率yik在目標域上的條件熵實現:
(5)
其中是條件熵損失函數。通過最小化熵(5),label預測器可以直接訪問目標域未標記的數據。
最終的目標函數爲:
總的來說,SAN的思想是讓 通過有監督的方式優化標籤預測器,最小化預測損失值,讓網絡根據 儘可能分類好樣本,同時又要讓域判別器的損失最大化,以至於域判別器能夠更準確的判斷出 是屬於所有類別k中的哪一類,好給樣本分配權重,讓屬於與目標域相關的源域類別樣本的權值高,而屬於異常類的權值低。
實驗結果