利用GAN生成二次元頭像項目對GAN訓練的探索

原創

2020-05-01 03:38

代碼放在了github上：Mobilenet+GAN
因爲國內對discriminator的叫法很多，所以筆者這裏就直接用英文了。
二次元頭像只需要利用最簡單的DCGAN網絡結構就可以穩定，快速地訓練出來。因爲本篇重點不是DCGAN，這裏對DCGAN就不做介紹了。
筆者這次利用Mobilenet-v1中的depth-wise seperable 結構來做GAN的鑑定器，並與DCGAN進行對比。也對一些參數進行了調整以做對比。

1、depth-wise seperable 結構用作discriminator時，訓練結果並不穩定，而且收斂較慢，效果不太好。
2、處理圖片時，歸一化到【-1,1】比【0,1】好，後者生成的圖片偏亮。還有在保存生成的圖片時，一定要講生成器調爲eval模式，否則生成圖片依然會偏亮。
3、discriminator太強時，生成器就已經學不到東西了。這裏可以參考知乎上面一篇還算詳細的推導：鏈接
4、我們一般在更新完discriminator後更新生成器，這時我們會重新產生一個生成器的輸入，經過生成器擬合以後，然後再把生成器的輸出拿給discriminator打分，並更新生成器參數。筆者嘗試同時更新兩者的參數：即
只產生一次輸入，得到discriminator的輸出後，同時計算loss，並對discriminator以及生成器進行更新。筆者對每種更新方式訓練了大概10次，每次50個epoch(1280張圖片)，得到的平均損失函數圖像如下所示：

從圖中可以很明顯看到同時更新參數的生成器訓練的更好一些(紅線),而對discriminator並沒有明顯影響。
5、discriminator的輸入層不要接BatchNormalization，輸出層加個sigmoid可以加快收斂。

其他效果圖可以在github上看到。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

利用GAN生成二次元頭像項目對GAN訓練的探索

釘釘打卡速度慢

Nginx R31 doc 官方文檔-01-nginx 如何安裝

Python 潮流週刊#51：用 Python 繪製美觀的圖表

Qt/C++音視頻開發74-合併標籤圖形/生成yolo運算結果圖形/文字和圖形合併成一個/水印濾鏡

挑戰程序設計競賽 2.2章習題 POJ - 3617 Best Cow Line 貪心

字節面試：MySQL什麼時候鎖表？如何防止鎖表？

.NET8連接SQL SERVER 2008 R2 報：證書鏈是由不受信任的頒發機構頒發的

golang開發環境搭建(win10)

python計算機視覺學習筆記——PIL庫的用法

Golang初學：獲取程序內存使用情況，std runtime

使用python 中的socket包實現本地電腦與阿里雲ECS服務器的通信

深度學習入門:pytorch實戰CIFAR10圖片分類

利用深度可分離卷積(depth-wise seperable convolution)和DCGAN生成二次元頭像

Vue 建站 Unexpected token o in JSON at position 1

vue.js框架+mintUI 網站自建之討厭的BUG：JS報錯 Uncaught TypeError: undefined is not a function

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結