論文閱讀筆記《Adversarial Feature Hallucination Networks for Few-Shot Learning》

核心思想

  本文提出一種基於數據增強的小樣本學習算法(AFHN),利用生成對抗網絡(GAN)實現數據集的擴充。數據增強的方法被認爲可以增強類內樣本方差的多樣化,從而實現更加清晰地分類界限。先前的數據增強方法主要包含兩類:一類是通過在基礎數據集上學習一種變換映射,並將其直接應用到新的數據集上,得到映射後的合成圖像用於數據擴充,這一類方法會破壞合成圖像的區分能力(因爲合成圖像很粗糙,與原始類別並不相似);另一類方法是根據特定的任務生成對應的合成圖像,這類方法保證了合成圖像的區分能力,但特定的任務約束使得合成的圖像容易陷入一種特定的模式,從而喪失了多樣性(在GAN中這種情況稱之爲Mode Collapse,就是指生成的圖像之間太過於相似,不具備多樣性)。本文利用conditional Wasserstein Gener- ative Adversarial Networks ,cWGAN(與普通的GAN相比,cWGAN就是通過改進目標函數,進而提高訓練穩定性的一個變種,此處不再詳細介紹)生成樣本,並通過增加分類正則項(classification regularizer)和 “反陷入”正則項(anti-collapse regularizer),解決了生成樣本缺少區分能力和多樣性的問題。本文提出算法的處理流程如下圖
在這裏插入圖片描述
  首先支持集圖像和查詢集圖像經過特徵提取網絡FF得到對應的特徵向量,支持集對應的特徵向量爲ss(如果有多個樣本則取平均值),從[0,1]的均勻分佈中採樣得到兩個隨機變量z1,z2z_1,z_2。然後將特徵向量ssz1,z2z_1,z_2輸入到cWGAN的生成器GG中,得到合成的向量s~1,s~2\tilde{s}_1,\tilde{s}_2,過程如下
在這裏插入圖片描述
將生成的s~1,s~2\tilde{s}_1,\tilde{s}_2與原始的ssz1,z2z_1,z_2輸入到區分器DD中,並計算GAN損失LGAN{L}_{GAN},過程如下
在這裏插入圖片描述
  而單純的GAN損失並不能解決生成樣本缺少區分能力和多樣性的問題,因此本文又設計了兩個正則化項:分類正則項(classification regularizer)和 “反陷入”正則項(anti-collapse regularizer)。其中分類正則項很好理解,首先利用softmax函數根據生成的樣本s~\tilde{s}得到查詢樣本xqx_q對應類別的概率,計算過程如下
在這裏插入圖片描述
式中q=F(xq)q=F(x_q),然後再利用交叉熵損失函數計算分類損失,作爲分類正則項LcriL_{cr_i},該正則項的目的是爲了增強生成樣本的區分能力
在這裏插入圖片描述
而“反陷入”正則項則是直接對兩個合成特徵向量的不相似度和產生它們的兩個噪聲向量的不相似度的比值進行懲罰,文字表述比較複雜,我們直接看公式
在這裏插入圖片描述
式中,分子部分表示了兩個合成特徵向量之間的不相似度,而分母表示兩個噪聲向量之間的不相似度。有研究表明z1z_1z2z_2越相似,則s~1\tilde{s}_1s~2\tilde{s}_2越容易陷入同一種模式。當z1z_1z2z_2很相似時,也就是分母很小時,上式則相當於放大了s~1\tilde{s}_1s~2\tilde{s}_2之間的不相似度(因爲要除以一個遠小於1的數字)。該正則項的目的時爲了增強生成樣本的多樣性。
  最後,將生成的樣本s~\tilde{s}與原始樣本ss一起輸入到分類器CC中,進而實現對於查詢樣本xqx_q的分類。

實現過程

網絡結構

  特徵提取網絡採用ResNet網絡,生成器和區分器均採用帶有Leaky ReLU激活函數的兩層MLP網絡。

損失函數

  對於生成對抗網絡部分損失函數如下
在這裏插入圖片描述
值得注意的是“反陷入”正則項LarL_{ar}取了倒數,因此對於生成器而言是希望生成的s~1\tilde{s}_1s~2\tilde{s}_2之間的不相似度越大越好。
  對於分類器部分採用簡單的分類損失函數進行訓練
在這裏插入圖片描述

訓練策略

  本文的訓練過程如下
在這裏插入圖片描述

創新點

  • 本文利用cWGAN網絡生成樣本,用於數據集擴充,改善小樣本分類效果
  • 設計了兩個正則化項,提高了生成樣本的區分能力和多樣性

算法評價

  本文還是比較標準的採用GAN生成樣本,進而實現數據增強的算法。這一類方法通常因爲樣本太少,導致生成的樣本效果太差,而無法起到數據增強的效果。而本文通過採用穩定性更好的cWGAN算法,並設計兩個正則化項,改善了生成樣本的效果,使其能夠應用於小樣本學習算法。

如果大家對於深度學習與計算機視覺領域感興趣,希望獲得更多的知識分享與最新的論文解讀,歡迎關注我的個人公衆號“深視”。在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章