【乾貨】計算機也會ps圖片：TL-GAN（附代碼和sildes下載）

原創

2018-12-17 15:55

【導讀】生成對抗網絡（GAN/Generative Adversarial Networks）是Ian Goodfellow在2014發表的文章：Generative Adversarial Networks，中最先提出的。GAN在近幾年也是機器學習、計算機視覺等方向的研究熱點之一。今天給大家帶來的是Shaobo GUAN利用TL-GAN生成定製化的逼真面孔照片項目（附Slides下載和代碼鏈接）。

Shaobo GUAN簡介：

Insight Data Science的AI研究員，計算和認知神經科學博士，研究興趣機器學習。個人LinkedIn主頁：https://www.linkedin.com/in/shaobo-guan/

我們知道各種版本GAN（如PG-GAN）可以從潛在空間（latent space ）中的隨機噪聲向量生成隨機逼真的圖像，但是卻無法控制圖像生成的過程，也就無法定製化的生成圖像，控制生成圖像的特徵。

由於圖像由潛在空間中的初始的隨機噪聲向量生成的，所以如果我們可以理解並控制這些初始的隨機噪聲向量，那麼就可以控制圖像的生成過程。TL-GAN（transparent latent-space GAN）在已有訓練好的GAN生成器的基礎上，將生成器和特徵提取器網絡組合（coupled feature extractor network）發現潛在空間的特徵軸（feature axes）。當向量沿着潛在空間中的特徵軸移動時，生成的圖像就會沿着該特徵發生變形，這就使得受控合成和編輯圖像成爲可能。

TL-GAN的idea：

已訓練好的GAN

圖片特徵提取

發現特徵軸（TL-GAN架構）

利用特徵軸控制圖像生成過程

TL-GAN的優點：

速度更快；
可以靈活的配置特徵提取器提取你想要的圖像特徵；

GitHub上項目代碼鏈接：

https://github.com/SummitKwan/transparent_latent_gan

參考鏈接：

https://blog.insightdatascience.com/generating-custom-photo-realistic-faces-using-ai-d170b1b59255

請關注專知公衆號（掃一掃最下面專知二維碼，或者點擊上方藍色專知）

後臺回覆“TLGAN” 就可以獲取該Slides下載鏈接~

附全部Slides內容：

-END-

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

24小時熱門文章

SQL優化-20231016

最新文章

最新評論文章