GAN論文1：Data Augmentation in Emotion Classification Using Generative Adversarial Networks論文筆記

原創

2020-06-07 03:28

GAN論文閱讀1:Data Augmentation in Emotion Classification Using Generative Adversarial Networks

附論文鏈接:https://arxiv.org/abs/1711.00648
最近看了幾篇GAN的論文，寫一下每篇論文的大致思路以便自己日後查看。如有問題，請留言指正。

論文思路

這篇論文主要應用CyCleGAN生成數據，利用新生成的數據補充數據流型訓練分類器，最後實驗證明比之前的效果要好。但是有一定的數據侷限性，應用CycleGAN必須有兩個域的數據，論文中叫參考域和目標域，兩個領域的數據要相近，比如自然狀態下的人臉表情和帶有情緒的人臉表情，可以實現互相的轉換，從參考域生成目標域的圖像。所以，這篇論文對於我們想利用GAN生成較少類數據訓練分類器的目的來說幫助不大。下面簡單介紹下論文中的框架結構。

論文的網絡結構

論文主要有三點貢獻：

通過使用GAN的數據增強技術提出了一個網絡結構；
通過在三個基準數據集上有經驗的學習，我們發現我們的新模型性能有了顯著提高；
我們結合了LSGAN中的最小平方誤差損失和CyCleGAN中的對抗損失，避免梯度消失的問題，在訓練過程中這被驗證是有效的。

論文結構如上圖，其實就是CycleGAN+CNN（SVM）的組合，R和T分別是參考域和目標域的來自於原始數據集的抽樣數據，目的是訓練一個網絡，最終能實現R到T的圖片轉換。CyCleGAN有兩個生成器G,F和兩個判別器D®和D(T)，其中G可以實現R到T的轉換，F實現T到R的轉換，而且爲了保持循環一致性，F(G®)≈R。這是典型的CyCleGAN模型。

最有意思的是論文中提出了Data Manifold概念，我之前沒有接觸過這個概念。對於不平衡的數據分類任務，分類器學習到的分類超平面或者說是分類邊界與完整的數據流型差別還是很大的。最重要的解決方法是進一步補充和完善Data Manifold。如下圖所示：b圖是不平衡分佈學習到的分類邊界；c圖是平衡分佈學習到的。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

GAN論文1：Data Augmentation in Emotion Classification Using Generative Adversarial Networks論文筆記

GAN論文閱讀1:Data Augmentation in Emotion Classification Using Generative Adversarial Networks

論文思路

論文的網絡結構

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

記一次 .NET某工控視覺自動化系統卡死分析

WindowsServer--SQL Server搭建主從同步實現讀寫分離 - 事務性分發

java由於越界導致的報錯

對RCNN論文中的關鍵性問題的解釋

Ubuntu python3.5安裝mayavi庫

python光流法學習 II

GAN論文1：Data Augmentation in Emotion Classification Using Generative Adversarial Networks論文筆記

以DCGAN爲例，對Tensorboard的可視化的理解

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結