【乾貨】 計算機也會ps圖片:TL-GAN(附代碼和sildes下載)

【導讀】生成對抗網絡(GAN/Generative Adversarial Networks)是Ian Goodfellow在2014發表的文章:Generative Adversarial Networks,中最先提出的。GAN在近幾年也是機器學習、計算機視覺等方向的研究熱點之一。今天給大家帶來的是Shaobo GUAN利用TL-GAN生成定製化的逼真面孔照片項目(附Slides下載和代碼鏈接)。

Shaobo GUAN簡介:

Insight Data Science的AI研究員,計算和認知神經科學博士,研究興趣機器學習。個人LinkedIn主頁:https://www.linkedin.com/in/shaobo-guan/

我們知道各種版本GAN(如PG-GAN)可以從潛在空間(latent space )中的隨機噪聲向量生成隨機逼真的圖像,但是卻無法控制圖像生成的過程,也就無法定製化的生成圖像,控制生成圖像的特徵。

由於圖像由潛在空間中的初始的隨機噪聲向量生成的,所以如果我們可以理解並控制這些初始的隨機噪聲向量,那麼就可以控制圖像的生成過程。TL-GAN(transparent latent-space GAN)在已有訓練好的GAN生成器的基礎上,將生成器和特徵提取器網絡組合(coupled feature extractor network)發現潛在空間的特徵軸(feature axes)。 當向量沿着潛在空間中的特徵軸移動時,生成的圖像就會沿着該特徵發生變形,這就使得受控合成和編輯圖像成爲可能。

TL-GAN的idea:

  • 已訓練好的GAN
  • 圖片特徵提取
  • 發現特徵軸(TL-GAN架構)
  • 利用特徵軸控制圖像生成過程

TL-GAN的優點:

  1. 速度更快;
  2. 可以靈活的配置特徵提取器提取你想要的圖像特徵;

GitHub上項目代碼鏈接:

https://github.com/SummitKwan/transparent_latent_gan

參考鏈接:

https://blog.insightdatascience.com/generating-custom-photo-realistic-faces-using-ai-d170b1b59255

請關注專知公衆號(掃一掃最下面專知二維碼,或者點擊上方藍色專知)

  • 後臺回覆“TLGAN” 就可以獲取該Slides下載鏈接~

附全部Slides內容:

-END-

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章