Adaptive Transfer Network for Cross-Domain Person Re-Identification

原創

2020-02-25 06:58

行人重識別之多維度數據庫風格遷移

Adaptive Transfer Network for Cross-Domain Person Re-Identification
原文鏈接

之前研讀的數據庫風格遷移方面的文章，直接使用cyclegan對風格進行遷移，外加一些損失函數進行約束。這篇文章對數據庫之間差異的原因進行分析並分爲三類：光照差異、攝像頭角度差異、分辨率差異。在此基礎上，利用三者進行風格遷移。

如圖所示，是使用本文框架進行風格遷移的三個例子。可以看出，使用三個cyclegan實現光照、攝像頭視角、分辨率的風格遷移，然後對其賦予不同的權重，從而合成最後的遷移圖像。

其具體框架如下圖：

使用編碼器提取三個維度的特徵z，然後根據圖下的網絡計算出的權重對三個特徵加權連接，生成新的圖像。

與其它論文類似，每一個gan網絡的損失函數由三部分組成，gan的損失，cyclegan的損失，類內標籤損失。這裏再解釋一下類內標籤損失，即生成後的圖像和原圖像還是同一個人的特徵。損失函數如下所示：

權重計算方法：
作者認爲，三個gan對應的損失越大，那麼該圖像的這個維度與生成的圖像的關聯越小。所以，在訓練的過程中，作者使用損失的倒數作爲三個維度的權重，以獲得訓練時的標籤。訓練的輸入是圖像對，一張來自源域，一張來自目標域。

總結：這篇文章從三個角度進行數據風格遷移，是一個亮點。然而在一些細節方面介紹的實在不夠清楚，可能是受困於會議文章的長度。

完
歡迎討論歡迎吐槽

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.