【GAN】三、DCGAN論文詳解

原創

2020-06-14 00:02

寫在前面

在前面一篇博客：【GAN】二、原始GAN論文詳解中我們主要介紹了原始GAN模型的網絡結構，訓練方法以及相關GAN網絡架構中的數學結論。那麼在這篇博客中，我們將主要介紹原始GAN之後的又一種模型——DCGAN。DCGAN將GAN與CNN相結合，奠定後幾乎所有GAN的基本網絡架構。DCGAN極大地提升了原始GAN訓練的穩定性以及生成結果質量。

DCGAN的論文連接爲：UNSUPERVISED REPRESENTATION LEARNINGWITH DEEP CONVOLUTIONAL GENERATIVE ADVERSARIAL NETWORKS

對於DCGAN的實戰，可以參照GAN系列的第一篇博客：【GAN】一、利用keras實現DCGAN生成手寫數字圖像。

一、DCGAN網絡架構

DCGAN主要是在網絡架構上改進了原始GAN，DCGAN的生成器與判別器都利用CNN架構替換了原始GAN的全連接網絡，主要改進之處有如下幾個方面：

DCGAN的生成器和判別器都捨棄了CNN的池化層，判別器保留CNN的整體架構，生成器則是將卷積層替換成了反捲積層（fractional-strided convolution）或者叫轉置卷積層（Convolution Transpose）。
在判別器和生成器中在每一層之後都是用了Batch Normalization（BN）層，有助於處理初始化不良導致的訓練問題，加速模型訓練，提升了訓練的穩定性。
利用1*1卷積層替換到所有的全連接層。
在生成器中除輸出層使用Tanh（Sigmoid）激活函數，其餘層全部使用ReLu激活函數。
在判別器所有層都使用LeakyReLU激活函數，防止梯度稀。

下面是DCGAN的生成器網絡架構圖。

接下來我們給出DCGAN的訓練細節：

將訓練圖像數據進行標準化處理，範圍爲[-1,1]，由於像素值範圍爲0-255，因此將圖像減去均值127.5之後再除以127.5即可。
建議使用Adam優化算法進行優化參數，學習率爲0.0002而不是0.001，Adam優化算法的 $\beta_{1}=0.5$ , $\beta_{1}=0.9$ 會導致訓練振盪與不穩定。
權重隨機初始化，數據分佈服從 $N(0,0.02)$ ,LeakyReLU的斜率爲0.2，batch_size = 128。

二、實驗結果

在LSUN數據集上的實驗結果

DCGAN的矢量計算表示：

後記

至此，DCGAN的相關內容全部介紹完了，對於DCGAN的實戰，可以參照GAN系列的第一篇博客：【GAN】一、利用keras實現DCGAN生成手寫數字圖像。

在接下來我們將將介紹CGAN即條件GAN，條件GAN的提出使得GAN根據某種條件進行生成圖片，即可以使得GAN無監督算法轉變成了有監督算法。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

【GAN】三、DCGAN論文詳解

寫在前面

一、DCGAN網絡架構

二、實驗結果

後記

vue項目獲取富文本編輯器wangEditor內容導出爲word（html轉word格式並下載）

dotnet C# 創建 X11 應用時設置窗口背景顏色

Navicat安裝與激活教程

TDengine docker安裝方法

vue3組件通信與props

sapui5

Alpine Linux apk add DNS lookup error

部分JDK版本的發佈時間

工作中用到的腳本合集

合併代碼時Beyond Compare設置

運籌學與最優化理論基礎——高精度加減乘除(C++實現)

【R-CNN目標檢測系列】六、Faster R-CNN論文解讀

【深度神經網絡】一、AlexNet網絡架構詳解

【R-CNN目標檢測系列】一、選擇性搜索詳解

【R-CNN目標檢測系列】二、邊界框迴歸（Bounding-Box Regression）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結