【干货】 计算机也会ps图片:TL-GAN(附代码和sildes下载)

【导读】生成对抗网络(GAN/Generative Adversarial Networks)是Ian Goodfellow在2014发表的文章:Generative Adversarial Networks,中最先提出的。GAN在近几年也是机器学习、计算机视觉等方向的研究热点之一。今天给大家带来的是Shaobo GUAN利用TL-GAN生成定制化的逼真面孔照片项目(附Slides下载和代码链接)。

Shaobo GUAN简介:

Insight Data Science的AI研究员,计算和认知神经科学博士,研究兴趣机器学习。个人LinkedIn主页:https://www.linkedin.com/in/shaobo-guan/

我们知道各种版本GAN(如PG-GAN)可以从潜在空间(latent space )中的随机噪声向量生成随机逼真的图像,但是却无法控制图像生成的过程,也就无法定制化的生成图像,控制生成图像的特征。

由于图像由潜在空间中的初始的随机噪声向量生成的,所以如果我们可以理解并控制这些初始的随机噪声向量,那么就可以控制图像的生成过程。TL-GAN(transparent latent-space GAN)在已有训练好的GAN生成器的基础上,将生成器和特征提取器网络组合(coupled feature extractor network)发现潜在空间的特征轴(feature axes)。 当向量沿着潜在空间中的特征轴移动时,生成的图像就会沿着该特征发生变形,这就使得受控合成和编辑图像成为可能。

TL-GAN的idea:

  • 已训练好的GAN
  • 图片特征提取
  • 发现特征轴(TL-GAN架构)
  • 利用特征轴控制图像生成过程

TL-GAN的优点:

  1. 速度更快;
  2. 可以灵活的配置特征提取器提取你想要的图像特征;

GitHub上项目代码链接:

https://github.com/SummitKwan/transparent_latent_gan

参考链接:

https://blog.insightdatascience.com/generating-custom-photo-realistic-faces-using-ai-d170b1b59255

请关注专知公众号(扫一扫最下面专知二维码,或者点击上方蓝色专知)

  • 后台回复“TLGAN” 就可以获取该Slides下载链接~

附全部Slides内容:

-END-

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章