CVPR2020論文筆記-風格遷移方向（一）

原創

2020-06-21 17:32

CVPR2020論文筆記：Diversified Arbitrary Style Transfer via Deep Feature Perturbation

概述

提出了一種利用正交隨機噪聲矩陣對WCT的過程進行修改的方法，從而能夠讓風格遷移更具有多樣性

方法

核心思想是在加入正交噪聲矩陣豐富多樣性的基礎上，保證WCT過程中style紋理，也就是Gram矩陣不變。也就是說即使用正交噪聲矩陣擾動前後feature map和原先不同了，但是Gram Matrix（style 紋理）不變。
Gram Matrix計算：

這個噪聲擾動的方法能夠保證style圖的Gram Matrix和擾動後的圖的Gram Matrix完全相同，即上面的計算結果爲0.
原始的WCT計算公式如下：
加入擾動正交噪聲矩陣Z：

證明加入擾動正交噪聲矩陣Z之後還是和style圖一樣的style紋理（相同的Gram Matrix）

實驗以及消融分析

作者發現只直接採用擾動後的結果進行輸出，會對內容結構有很大的破壞，風格化的結果並不好，所以加入了兩個權重平衡這個影響（分別爲diversity 超參數和 stylization 超參數），但是對於colosed-form方法影響很小（WCT以及MST影響都很大），推測可能是由於其考慮了內容架構的損失也最優。
多層級的擾動，結果會糟糕；單層級的擾動而言，擾動的層級越低，最後結果越糟糕，質量越低。所以多層級的擾動沒有必要
擾動噪聲矩陣的採樣的分佈類型（正態或者均勻分佈）以及其相關參數對結果影響不大，但是採用隨機噪聲矩陣而不採用正交噪聲矩陣對結果影響很大，隨機噪聲的話結果很差，會淹沒內容架構。
擾動矩陣Z可以放在多個位置，放在中間時計算量最小，因爲其對應的矩陣維度最小。
過大的diversity超參數會讓內容架構很大程度破壞，這時就需要較小的stylization超參數來均衡了，才能保證一個不錯的風格化結果。
通過正交噪聲矩陣的插入確實能夠增加風格化的多樣性

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

24小時熱門文章

最新文章

最新評論文章