論文閱讀筆記《TransMatch: A Transfer-Learning Scheme for Semi-Supervised Few-Shot Learning》

原創

2020-07-02 15:26

核心思想

本文提出一種基於遷移學習的半監督小樣本學習算法（TransMatch）。整個算法並不複雜，首先利用帶有標籤的基礎數據集訓練特徵提取網絡，然後用該特徵提取網絡爲新的數據集初始化分類器權重，最後用半監督學習的方式進一步更新整個網絡。整個流程如下圖所示

第一階段：預訓練階段。這一階段沒有什麼值得介紹的，就是用帶有標籤的基礎數據集對特徵提取器進行訓練。
第二階段：分類器權重“生成”階段（Classifier Weight Imprinting）。在這一階段，使用已經預訓練好的特徵提取網絡，對新的帶有標籤的數據集進行特徵提取，並生成對應的分類器權重。本文采用一種叫做Weight Imprinting的方法來生成分類器的權重，方法如下

式中 $w_c$ 表示類別 $c$ 對應的分類器權重， $f^e$ 表示特徵提取網絡， $x^c_k$ 表示類別 $c$ 中第 $k$ 個樣本。通過上式得到每個類別對應的權重後，再通過計算餘弦距離的方式進行分類

式中對於樣本 $x$ ，分別計算其與 $N$ 個類別權重之間的餘弦相似度，並選擇餘弦相似度最高的哪一類作爲預測結果。
第三階段：半監督微調訓練階段。在這一階段採用新的帶有標籤的數據集 $D^{novel}$ 和與 $D^{novel}$ 類別相同但不帶有標籤的數據集，共同對網絡進行微調訓練。本文采用MixMatch的方式進行半監督訓練，定義 $\mathcal{L}=\left \{(x_i,p_i)\right \}^B_{i=1}$ 表示 $B$ 個帶有標籤 $p_i$ 的樣本， $\mathcal{U}=\left \{(x_u)\right \}^U_{u=1}$ 表示 $U$ 個不帶有標籤的樣本。首先對每個無標籤的樣本 $x_u$ 進行數據擴充（應該採用的是常規的翻轉，放縮等形式）得到 $M$ 個合成樣本 $\left \{x_{u,i},...,x_{u,M}\right \}$ ，然後用第二階段訓練得到的分類器對每個無標籤樣本進行預測，並取 $M$ 個合成樣本的平均值作爲預測結果

銳化操作（sharpen operation）用於進一步增強預測結果

其中 $T=0.5$ ，這樣就得到了無標籤樣本對應的標籤信息了。將數據集 $\mathcal{L,U}$ 級聯後，再將順序打亂，得到新的混合數據集 $\mathcal{W}=Shuffle(Concat(\mathcal{L,U}))$ ，然後將其分爲以下兩個集合

其中混合操作MixUP計算過程如下

式中 $\lambda'=max(\lambda,1-\lambda)$ ， $\lambda$ 是從Beta分佈 $Beta(\alpha,\alpha)$ 中隨機生成的。

實現過程

網絡結構

特徵提取網絡採用寬闊的殘差網絡WRN-28-10。

損失函數

損失函數計算過程如下

其中

訓練策略

本文的訓練過程如下

創新點

採用基於遷移學習的半監督訓練方法實現小樣本學習任務
採用Weight Imprinting的方式進行分類器權重生成，採用MixUp方式進行半監督訓練

算法評價

與之前研究較多的採用元學習的小樣本學習方法不同，本文沿用了更爲傳統的遷移學習思想，並結合半監督學習方式，證明了遷移學習還是能夠在小樣本場景下取得較好的效果的。但本文核心創新點並不多，有一種拼湊的感覺。無論是Weight Imprinting分類器權重生成還是MixUp半監督訓練方法都是借鑑了別人的方案。

如果大家對於深度學習與計算機視覺領域感興趣，希望獲得更多的知識分享與最新的論文解讀，歡迎關注我的個人公衆號“深視”。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

論文閱讀筆記《TransMatch: A Transfer-Learning Scheme for Semi-Supervised Few-Shot Learning》

核心思想

實現過程

網絡結構

損失函數

訓練策略

創新點

算法評價

10分鐘搞定Mysql主從部署配置

如何使用 JS 判斷用戶是否處於活躍狀態

「Pygors跨平臺GUI」2：安裝MinGW-w64、MSYS2還是WSL2

[轉帖]

python列出centos7內存使用前50的進程信息

「Pygors跨平臺GUI」1：Pygors跨平臺GUI應用研究

一鍵自動化博客發佈工具,用過的人都說好(掘金篇)

lightdb數據庫超時相關控制參數

lightdb秒級增加列和刪除列（not null帶默認值）

Java ThreadPoolShutdown

論文閱讀筆記《Improved Few-Shot Visual Classification》

論文閱讀筆記《DPGN: Distribution Propagation Graph Network for Few-shot Learning》

論文閱讀筆記《Adaptive Subspaces for Few-Shot Learning》

論文閱讀筆記《TransMatch: A Transfer-Learning Scheme for Semi-Supervised Few-Shot Learning》

論文閱讀筆記《DeepEMD: Few-Shot Image Classification with Differentiable Earth Mover’s Distance》

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結