論文閱讀筆記《Adaptive Subspaces for Few-Shot Learning》

原創

2020-07-02 15:26

核心思想

本文提出一種基於度量學習的小樣本分類算法（DSN）。作者引入了子空間的概念，爲每種類別都尋找到一個適合的子空間，然後在子空間中進行距離度量，並預測類別。首先作者介紹了幾種常見的基於度量學習的小樣本分類器，其分類方式如下圖所示

（a）成對的分類器，分別計算查詢樣本對應的特徵向量和每個支持樣本對應的特徵向量之間的距離，然後按照最近鄰的思想預測類別，如Matching Network。
（b）原型分類器，爲支持集中每個類別計算出一個原型（每個類別所有樣本特徵向量的平均值），然後根據查詢樣本的特徵向量與各個類別原型之間的距離預測類別，如Prototypical Network。
（c）非線性二元分類器，利用神經網絡學習到一個非線性的距離度量函數，如Relation Network。
（d）子空間分類器，爲每個類別計算出一個特徵空間的子空間，然後將查詢樣本的特徵向量投射到子空間中，在子空間中進行距離度量，並預測類別，如本文的算法（DSN）。DSN的處理過程如下圖所示

首先，利用特徵提取器 $f_{\Theta}$ 將輸入圖像映射到特徵空間中得到對應的特徵向量 $f_{\Theta}(x_i)$ ，然後通過平均的方式計算每個類別 $c$ 對應的特徵向量均值 $\mu_c$ ，計算過程如下

對於每個類別 $c$ 都可以得到集合 $\tilde{X}_c=[f_{\Theta}(x_{c,1})-\mu_c,...,f_{\Theta}(x_{c,K})-\mu_c]$ ，對 $\tilde{X}_c$ 進行奇異值分解（SVD）得到 $\tilde{X}_c=U\sum V^T$ ，然後選取 $U$ 中前 $n$ 個維度得到截斷矩陣 $P_c$ ，由 $\tilde{X}_c$ 得到子空間 $P_c$ 的過程其實就是截斷奇異值分解（TSVD）,其與主成分分析PCA非常類似，是一種數據降維的方法。得到每個類別對應的子空間 $P_c$ 後，可以計算查詢向量 $f_{\Theta}(q)$ 與每個類別之間的距離 $d(q)$ ，計算過程如下

式中 $M_c=P_cP_c^T$ ，最後利用softmax函數計算查詢樣本屬於各個類別的概率 $p_{c,q}$ ，計算過程如下