訓練GAN的一些小貼士

轉載：https://zhuanlan.zhihu.com/p/86274515

下面是我認識到自己犯過的一些錯誤，以及我從中學到的一些東西。所以，如果你是GANs的新手，並沒有看到在訓練方面取得很大的成功，也許看看以下幾個方面會有所幫助:

大卷積核和更多的濾波器

更大的卷積核覆蓋了前一層圖像中的更多像素，因此可以查看更多信息。5x5的核與CIFAR-10配合良好，在判別器中使用3x3核使判別器損耗迅速趨近於0。對於生成器，你希望在頂層的卷積層有更大的核，以保持某種平滑。在較低的層，我沒有看到改變內核大小的任何主要影響。

濾波器的數量可以大量增加參數的數量，但通常需要更多的濾波器。我在幾乎所有的卷積層中都使用了128個濾波器。使用較少的濾波器，特別是在生成器中，使得最終生成的圖像過於模糊。因此，看起來更多的濾波器可以幫助捕獲額外的信息，最終爲生成的圖像增加清晰度。

標籤翻轉(Generated=True, Real=False)

雖然一開始看起來很傻，但對我有用的一個主要技巧是更改標籤分配。

如果你使用的是Real Images = 1，而生成的圖像= 0，則使用另一種方法會有所幫助。正如我們將在後面看到的，這有助於在早期迭代中使用梯度流，並幫助使梯度流動。

使用有噪聲的標籤和軟標籤

這在訓練判別器時是非常重要的。硬標籤(1或0)幾乎扼殺了早期的所有學習，導致識別器非常快地接近0損失。最後，我使用0到0.1之間的隨機數表示0標籤(真實圖像)，使用0.9到1.0之間的隨機數表示1標籤(生成的圖像)。在訓練生成器時不需要這樣做。

此外，增加一些噪音的訓練標籤也是有幫助的。對於輸入識別器的5%的圖像，標籤被隨機翻轉。比如真實的被標記爲生成的，生成的被標記爲真實的。

使用批歸一化是有用的，但是需要有其他的東西也是合適的

批歸一化無疑有助於最終的結果。添加批歸一化後，生成的圖像明顯更清晰。但是，如果你錯誤地設置了卷積核或濾波器，或者識別器的損失很快達到0，添加批歸一化可能並不能真正幫助恢復。

每次一個類別

爲了更容易地訓練GANs，確保輸入數據具有相似的特徵是很有用的。例如，與其在CIFAR-10的所有10個類中都訓練GAN，不如選擇一個類(例如，汽車或青蛙)並訓練GANs從該類生成圖像。DC-GAN的其他變體在學習生成多個類的圖像方面做得更好。例如，以類標籤爲輸入，生成基於類標籤的圖像。但是，如果你從一個普通的DC-GAN開始，最好保持事情簡單。

查看梯度

如果可能的話，試着監控梯度以及網絡中的損失。這些可以幫助你更好地瞭解訓練的進展，甚至可以幫助你在工作不順利的情況下進行調試。

理想情況下，生成器應該在訓練的早期獲得較大的梯度，因爲它需要學習如何生成真實的數據。另一方面，判別器並不總是在早期獲得較大的梯度，因爲它可以很容易地區分真假圖像。一旦生成器得到足夠的訓練，判別器就很難分辨真假圖像。它會不斷出錯，並得到大的梯度。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

訓練GAN的一些小貼士

Linux的各種操作

Mac程序的一些快捷方法總結—網絡整理

ICCV2019 paper list Person Re-ID

數據出現NoneType

與張量無關的，gather數據索引錯誤

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結