Cycle-VAE-GAN《Camera Style Adaptation for Person Re-identification》替换CycleGAN中生成器为VAE

原創

2020-07-01 17:06

对Cycle-GAN网络结构的修改，将原论文结构（下图）中的的ResnetGenerator（图中的GeneratorA2B和GeneratorB2A）替换成VAEGenerator，构建了Cycle-VAE-GAN的新结构来进行相机风格间的转换。

code：https://github.com/xr-Yang/CycleGAN-VAE-for-reid

对新结构进行了一定的实验测试，具体实验过程和测试过程如下。

实验过程：

1.利用Cycle-VAE-GAN训练market1501数据集下各相机风格的一个转换模型。

2.生成各相机间风格转换的图像。

测试过程：

1.定性分析：直观的对比两种方法生成图像的质量和清晰度。

2.定量分析：（1）通过FID（Frechet Inception Distance）和SSIM(Structural SIMilarity)两个公认的评价GAN网络生成图像质量的指标，对比测试Cycle-VAE-GAN和Cyle-GAN生成图像的质量。（2）通过原论文的训练方式加入Cycle-VAE-GAN生成的图像，对比ReID模型的mAP和rank-1

实验结果

1.定性的比较两种方法生成图像的质量和清晰度

             Cycle-VAE-GAN：                                                      Cycle-GAN：

   选取ID2同一张照片从cam1->cam2的风格转换图，从对比图像中直观来看，Cycle-VAE-GAN较cycle-GAN生成的图像更为清晰（如左上角的房间对比，人体的轮廓），生成器的能力更为出色，对图像中结构的恢复更好。

2.定量对比。从模型训练的时间，生成图像的质量FID和SSIM得分，以及在原论文的baseline下的精度等三方面进行一个定量的对比：

(注：FID——(lower is better)，SSIM——(higher is better))

从定量实验的对比结果，可得如下结论：

1.Cycle-VAE-GAN的训练耗时更少。将原始论文中的ResnetGenerator替换为VAE encoder，极大的缩减了卷积层的数量，提高了训练时间。

2.无论直观感受还是FID，SSIM等图像质量指标均能体现，Cycle-VAE-GAN具有更好的图像生成能力。

3.与原论文相比，在其baseline上精度更好，mAP和Rank-1均有提升。

欢迎大家讨论。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Cycle-VAE-GAN《Camera Style Adaptation for Person Re-identification》替换CycleGAN中生成器为VAE

Cycle-VAE-GAN《Camera Style Adaptation for Person Re-identification》替換CycleGAN中生成器爲VAE

行人Reid的入門基本知識

Collaborative Attention Network for Person Re-identification

Re-id多粒度網絡（MGN）的PPT彙報總結

彙總現階段reid方面一些SOTA的paper。

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結