GAN論文1:Data Augmentation in Emotion Classification Using Generative Adversarial Networks論文筆記

GAN論文閱讀1:Data Augmentation in Emotion Classification Using Generative Adversarial Networks

附論文鏈接:https://arxiv.org/abs/1711.00648
最近看了幾篇GAN的論文,寫一下每篇論文的大致思路以便自己日後查看。如有問題,請留言指正。

論文思路

這篇論文主要應用CyCleGAN生成數據,利用新生成的數據補充數據流型訓練分類器,最後實驗證明比之前的效果要好。但是有一定的數據侷限性,應用CycleGAN必須有兩個域的數據,論文中叫參考域和目標域,兩個領域的數據要相近,比如自然狀態下的人臉表情和帶有情緒的人臉表情,可以實現互相的轉換,從參考域生成目標域的圖像。所以,這篇論文對於我們想利用GAN生成較少類數據訓練分類器的目的來說幫助不大。下面簡單介紹下論文中的框架結構。

利用neutral表情生成其他表情

論文的網絡結構

在這裏插入圖片描述
論文主要有三點貢獻:

  1. 通過使用GAN的數據增強技術提出了一個網絡結構;
  2. 通過在三個基準數據集上有經驗的學習,我們發現我們的新模型性能有了顯著提高;
  3. 我們結合了LSGAN中的最小平方誤差損失和CyCleGAN中的對抗損失,避免梯度消失的問題,在訓練過程中這被驗證是有效的。

論文結構如上圖,其實就是CycleGAN+CNN(SVM)的組合,R和T分別是參考域和目標域的來自於原始數據集的抽樣數據,目的是訓練一個網絡,最終能實現R到T的圖片轉換。CyCleGAN有兩個生成器G,F和兩個判別器D®和D(T),其中G可以實現R到T的轉換,F實現T到R的轉換,而且爲了保持循環一致性,F(G®)≈R。這是典型的CyCleGAN模型。

最有意思的是論文中提出了Data Manifold概念,我之前沒有接觸過這個概念。對於不平衡的數據分類任務,分類器學習到的分類超平面或者說是分類邊界與完整的數據流型差別還是很大的。最重要的解決方法是進一步補充和完善Data Manifold。如下圖所示:b圖是不平衡分佈學習到的分類邊界;c圖是平衡分佈學習到的。
b圖是不平衡分佈學習到的分類邊界;c圖是平衡分佈學習到的

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章