【導讀】生成對抗網絡(GAN/Generative Adversarial Networks)是Ian Goodfellow在2014發表的文章:Generative Adversarial Networks,中最先提出的。GAN在近幾年也是機器學習、計算機視覺等方向的研究熱點之一。今天給大家帶來的是Shaobo GUAN利用TL-GAN生成定製化的逼真面孔照片項目(附Slides下載和代碼鏈接)。
Shaobo GUAN簡介:
Insight Data Science的AI研究員,計算和認知神經科學博士,研究興趣機器學習。個人LinkedIn主頁:https://www.linkedin.com/in/shaobo-guan/
我們知道各種版本GAN(如PG-GAN)可以從潛在空間(latent space )中的隨機噪聲向量生成隨機逼真的圖像,但是卻無法控制圖像生成的過程,也就無法定製化的生成圖像,控制生成圖像的特徵。
由於圖像由潛在空間中的初始的隨機噪聲向量生成的,所以如果我們可以理解並控制這些初始的隨機噪聲向量,那麼就可以控制圖像的生成過程。TL-GAN(transparent latent-space GAN)在已有訓練好的GAN生成器的基礎上,將生成器和特徵提取器網絡組合(coupled feature extractor network)發現潛在空間的特徵軸(feature axes)。 當向量沿着潛在空間中的特徵軸移動時,生成的圖像就會沿着該特徵發生變形,這就使得受控合成和編輯圖像成爲可能。
TL-GAN的idea:
- 已訓練好的GAN
- 圖片特徵提取
- 發現特徵軸(TL-GAN架構)
- 利用特徵軸控制圖像生成過程
TL-GAN的優點:
- 速度更快;
- 可以靈活的配置特徵提取器提取你想要的圖像特徵;
GitHub上項目代碼鏈接:
https://github.com/SummitKwan/transparent_latent_gan
參考鏈接:
https://blog.insightdatascience.com/generating-custom-photo-realistic-faces-using-ai-d170b1b59255
請關注專知公衆號(掃一掃最下面專知二維碼,或者點擊上方藍色專知)
- 後臺回覆“TLGAN” 就可以獲取該Slides下載鏈接~
附全部Slides內容:
-END-