行人重識別之監督學習與無監督學習結合(CVPR2019)
Invariance Matters: Exemplar Memory for Domain Adaptive Person Re-identification
原文鏈接:https://arxiv.org/abs/1904.01990
這篇文章有兩個貢獻:
- 將監督學習和無監督學習結合
- 引入了存儲器的概念,比較新穎
上圖是網絡結構,有兩個分支。藍色分支是有標籤的source數據庫,對應監督學習,利用softmax計算分類損失。橙色分支對應無標籤的target數據庫,對應無監督學習(有三個損失函數,稍後介紹)。將兩個分支的損失加權相加,使兩個分支可以同步對網絡進行訓練。接下來分別介紹三個損失和存儲器的思想。
三個損失
- 不同的遠離
- 利用GAN生成一張圖片的幾個風格遷移圖片(對應攝像機風格),使其靠近。從而降低不同攝像頭的影響
- 相似的靠近
感覺這三個損失函數沒什麼特別的,但是文章卻把這個作爲了重中之重來介紹。(希望是我沒理解透徹,歡迎大佬指教)
存儲器
與上圖對應,第i個無標籤圖片經過網絡,獲得特徵向量v,存儲在key中,直接把它的類別存儲爲i(存在value中)。每輸入一個圖片,不僅要存在其中,還要與存儲器中所有的圖片計算損失。如果之前已經存過該圖片,那麼就利用下式對存儲器中它的特徵向量進行更新。其中k是存儲器中的特徵向量,f是網絡計算出來的特徵向量。a根據epoch數線性增加。
總結:存儲器的概念爲無監督學習提供了不錯的思路,值得借鑑。
完
歡迎討論 歡迎吐槽