【干货】计算机也会ps图片：TL-GAN（附代码和sildes下载）

原創

2018-12-17 15:55

【导读】生成对抗网络（GAN/Generative Adversarial Networks）是Ian Goodfellow在2014发表的文章：Generative Adversarial Networks，中最先提出的。GAN在近几年也是机器学习、计算机视觉等方向的研究热点之一。今天给大家带来的是Shaobo GUAN利用TL-GAN生成定制化的逼真面孔照片项目（附Slides下载和代码链接）。

Shaobo GUAN简介：

Insight Data Science的AI研究员，计算和认知神经科学博士，研究兴趣机器学习。个人LinkedIn主页：https://www.linkedin.com/in/shaobo-guan/

我们知道各种版本GAN（如PG-GAN）可以从潜在空间（latent space ）中的随机噪声向量生成随机逼真的图像，但是却无法控制图像生成的过程，也就无法定制化的生成图像，控制生成图像的特征。

由于图像由潜在空间中的初始的随机噪声向量生成的，所以如果我们可以理解并控制这些初始的随机噪声向量，那么就可以控制图像的生成过程。TL-GAN（transparent latent-space GAN）在已有训练好的GAN生成器的基础上，将生成器和特征提取器网络组合（coupled feature extractor network）发现潜在空间的特征轴（feature axes）。当向量沿着潜在空间中的特征轴移动时，生成的图像就会沿着该特征发生变形，这就使得受控合成和编辑图像成为可能。

TL-GAN的idea：

已训练好的GAN

图片特征提取

发现特征轴（TL-GAN架构）

利用特征轴控制图像生成过程

TL-GAN的优点：

速度更快；
可以灵活的配置特征提取器提取你想要的图像特征；

GitHub上项目代码链接：

https://github.com/SummitKwan/transparent_latent_gan

参考链接：

https://blog.insightdatascience.com/generating-custom-photo-realistic-faces-using-ai-d170b1b59255

请关注专知公众号（扫一扫最下面专知二维码，或者点击上方蓝色专知）

后台回复“TLGAN” 就可以获取该Slides下载链接~

附全部Slides内容：

-END-

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

24小時熱門文章

最新文章

最新評論文章