論文閱讀筆記《Improved Few-Shot Visual Classification》

原創

2020-07-02 15:27

核心思想

本文提出一種基於度量學習小樣本分類算法，在CNAPS算法的基礎上，對分類器部分進行改進，引入一種新的距離度量方式，減少了參數數量並且提高了分類的準確率。下面我們首先介紹CNAPS算法。

如上圖所示，CNAPS算法包含兩個部分：特徵提取器（黑色虛線框內的部分）和分類器（紅色框內的部分）。其中特徵提取器是由帶有FiLM層的ResNet-18網絡構成的，如下圖所示

FiLM層的作用是將BN層輸出的特徵圖進行一個仿射變換， $F_{out}=\gamma F_{in}+\beta$ ，然後再進入激活函數層。而 $\gamma$ 和 $\beta$ 兩個參數則是利用特徵提取器自適應模塊 $\psi_{\phi}^f$ 生成的，該模塊也包含兩個部分： $g_{\phi}$ 和 $\psi_{\phi}^j$ 。 $g_{\phi}$ 由一個深層網絡構成，根據支持集 $\mathcal{S}^{\tau}$ 生成對應的任務表徵 $g_{\phi}(\mathcal{S}^{\tau})$ ，而 $\psi_{\phi}^j$ 則是根據任務表徵 $g_{\phi}(\mathcal{S}^{\tau})$ 生成每個殘差塊對應的 $\gamma$ 和 $\beta$ 參數。經過該特徵提取網絡後得到查詢圖像和支持集圖像對應的特徵 $f_{\theta}^{\tau}(x_i^*)$ 和 $f_{\theta}^{\tau}(\mathcal{S}^{\tau})$ 。對於支持集中每幅圖像的特徵 $f_{\theta}^{\tau}(\mathcal{S}^{\tau})$ 按照類別通過平均池化的方式得到每類圖像對應的類別特徵 $\mu_k$ ，然後再經過類別自適應模塊 $\psi_{\phi}^c$ ，生成分類器中每各類別對應的權重 $w_k$ 和偏置 $b_k$ 。最後利用下式得到查詢集圖像屬於各個類別的概率值
$p(y_i=k|f_{\theta}^{\tau}(x_i^*),\mathcal{S}^{\tau})=softmax(w_k\times f_{\theta}^{\tau}(x_i^*)+b_k)$
本文保留了CNAPS算法中特徵提取的部分，但改進了分類器部分，使用一種新的距離度量方式取代了CNAPS算法中的類別自適應模塊，查詢集圖像屬於各個類別的概率值計算過程如下

式中 $Q_k^{\tau}$ 是針對類別 $k$ 和任務 $\tau$ 的協方差矩陣，其計算過程如下

式中 $\sum^{\tau}_k$ 表示任務 $\tau$ 中類別 $k$ 內各個圖像間的協方差矩陣，計算過程如下

而 $\sum^{\tau}$ 表示任務 $\tau$ 中所有類別的圖像之間的協方差矩陣，計算過程與 $\sum^{\tau}_k$ 相似，只不過將 $\mathcal{S}_k^{\tau}$ 改爲 $\mathcal{S}^{\tau}$ 。 $\beta$ 表示正則化參數，權重 $\lambda_k^{\tau}$ 計算過程如下

當每個類別僅包含一張圖像，即 $\left | \mathcal{S}_k^{\tau}\right |=1$ 時， $\lambda_k^{\tau}=0.5$ ，則 $Q_k^{\tau}$ 主要依賴於正則化參數 $\beta$ 的取值，而隨着每個類別中包含的圖像越多， $\lambda_k^{\tau}$ 的值越接近於1，且任務 $\tau$ 中類別 $k$ 內各個圖像間的協方差矩陣 $\sum^{\tau}_k$ 估計的約準確，則 $Q_k^{\tau}$ 主要依賴於 $\sum^{\tau}_k$ 。作者指出該方法不僅減少了大量的網絡參數（相對於CNAPS的分類器部分），且能夠關注到不同類別圖像之間的分佈情況，之前採用的歐式距離度量方式是假設所有類別圖像的協方差是統一的，而本文采用的方式則是考慮到不同類別的圖像其協方差是不同的，更加接近於真實情況，如下圖所示

實現過程

網絡結構

特徵提取網絡是由帶有FiLM層的ResNet-18網絡構成，分類器部分不需要網絡結構。

創新點

設計了新的距離度量方式，考慮不同類別圖像之間的協方差關係，取代了CNAPS算法中分類器部分

算法評價

本文是在對CNAPS算法進行的改進，雖然CNAPS算法對應的這篇文章《Fast and flexible multi-task classification using conditional neural adaptive processes》我並沒有讀過，但在本文中做了非常詳細的說明。相對於CNAPS算法，本文主要是改進了分類器部分，用一種無參數的距離度量方式取代原有的分類器網絡，在減少參數數量的同時，提高了分類的效果。而且本文中有一幅圖非常有趣，利用一個散點圖表示出各種類型的小樣本學習算法之間的關係，如下圖所示

如果大家對於深度學習與計算機視覺領域感興趣，希望獲得更多的知識分享與最新的論文解讀，歡迎關注我的個人公衆號“深視”。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

論文閱讀筆記《Improved Few-Shot Visual Classification》

核心思想

實現過程

網絡結構

創新點

算法評價

論文閱讀筆記《Improved Few-Shot Visual Classification》

論文閱讀筆記《DPGN: Distribution Propagation Graph Network for Few-shot Learning》

論文閱讀筆記《Adaptive Subspaces for Few-Shot Learning》

論文閱讀筆記《TransMatch: A Transfer-Learning Scheme for Semi-Supervised Few-Shot Learning》

論文閱讀筆記《DeepEMD: Few-Shot Image Classification with Differentiable Earth Mover’s Distance》

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結