【导读】生成对抗网络(GAN/Generative Adversarial Networks)是Ian Goodfellow在2014发表的文章:Generative Adversarial Networks,中最先提出的。GAN在近几年也是机器学习、计算机视觉等方向的研究热点之一。今天给大家带来的是Shaobo GUAN利用TL-GAN生成定制化的逼真面孔照片项目(附Slides下载和代码链接)。
Shaobo GUAN简介:
Insight Data Science的AI研究员,计算和认知神经科学博士,研究兴趣机器学习。个人LinkedIn主页:https://www.linkedin.com/in/shaobo-guan/
我们知道各种版本GAN(如PG-GAN)可以从潜在空间(latent space )中的随机噪声向量生成随机逼真的图像,但是却无法控制图像生成的过程,也就无法定制化的生成图像,控制生成图像的特征。
由于图像由潜在空间中的初始的随机噪声向量生成的,所以如果我们可以理解并控制这些初始的随机噪声向量,那么就可以控制图像的生成过程。TL-GAN(transparent latent-space GAN)在已有训练好的GAN生成器的基础上,将生成器和特征提取器网络组合(coupled feature extractor network)发现潜在空间的特征轴(feature axes)。 当向量沿着潜在空间中的特征轴移动时,生成的图像就会沿着该特征发生变形,这就使得受控合成和编辑图像成为可能。
TL-GAN的idea:
- 已训练好的GAN
- 图片特征提取
- 发现特征轴(TL-GAN架构)
- 利用特征轴控制图像生成过程
TL-GAN的优点:
- 速度更快;
- 可以灵活的配置特征提取器提取你想要的图像特征;
GitHub上项目代码链接:
https://github.com/SummitKwan/transparent_latent_gan
参考链接:
https://blog.insightdatascience.com/generating-custom-photo-realistic-faces-using-ai-d170b1b59255
请关注专知公众号(扫一扫最下面专知二维码,或者点击上方蓝色专知)
- 后台回复“TLGAN” 就可以获取该Slides下载链接~
附全部Slides内容:
-END-