遷移學習“Partial Transfer Learning with Selective Adversarial Networks”

原創

2019-06-18 16:07

Partial Transfer Learning with Selective Adversarial

Networks

摘要：對抗學習應用於深度網絡中學習可遷移的特徵初有成效，它降低了源域及目標域之間的分佈差異。目前已有的對抗網絡假設源域和目標域共享全部的標記空間。在遷移過程中，源域中類別往往很多，而目標域通常只和源域其中一小部分相關，直接遷移肯定會產生負遷移的影響。論文提出了部分遷移學習，減輕了標記空間的約束，目標域標記空間可以僅是源域的子集。論文提出的網絡稱爲選擇性對抗網絡（SAN），通過挑選出源域中outlier類減輕負遷移影響，並在共享的標記空間中最大化匹配數據分佈提升正遷移的影響。

從大數據的角度來看，可以假設源域中大規模訓練集包含了目標域的所有類別，目標域的label僅是源域的子集，如圖1所示，源域中的outlier（‘sofa’）將產生負遷移。

方法描述

部分遷移學習目標域標記空間是源域標記空間的子集，，實際應用中也是經常由大數據集（如ImageNet）向小數據集（CIFAR10）遷移。假設源域包含類共個樣本，目標域包含類共個未標記的樣本。源域和目標域的採樣概率分別爲p和q，遷移學習中，部分遷移學習。本文的目標是設計網絡學習遷移特徵及自適應分類器建立跨域差異的橋樑，通過源域的監督學習最小化目標風險：

遷移學習中，主要的挑戰是目標域沒有標記數據，由於分佈差異，源域中學習到的分類器不能直接用於目標域。在部分遷移學習中，源域中哪部分的label與目標域共享也不知道。一方面，源域中屬於outlier的標記數據將導致負遷移；另一方面，降低t與q間的分佈差異在知識遷移中比較關鍵。

域對抗網絡

對抗學習是雙人遊戲，其中一個是域分辨器，用於分辨源域和目標域，另外一個是特徵提取器，目的是迷惑域分辨器。

爲提取域不變的特徵f，特徵提取器的參數θf通過最大化域分辨器Gd的損失學習，域分辨器的參數通過最小化域分辨器的損失學習，同時最小化label預測器的損失。域對抗網絡的目標函數爲：

(1)

收斂時，網絡參數滿足：

(2)

對於標準遷移學習，源域與目標域標記空間相同的情況，域對抗網絡性能較好。

選擇性對抗網絡

目標域標記空間是源域的子集，outlier label空間越大，負遷移情況越嚴重，論文將outlier的源域類別選出去解決負遷移問題。

爲匹配具有不同標記空間的域，將域分辨器分離成個類別級域分辨器,k=1,…,Cs，每個負責label爲k的源域和目標域數據匹配，如圖2所示。由於目標域標記在訓練中不可訪問，決定哪個域分辨器對每個目標域數據負責並不容易。而label預測器的輸出是源域標記空間的概率分佈，該分佈描述了該分爲中的哪一類。可以使用作爲將分配給某個域分辨器,的概率。這樣生成概率加權的域分辨損失：