Paper Reading: A Multi-task Deep Network for Person Re-identification

Paper Reading Note

URL:
https://arxiv.org/pdf/1607.05369.pdf

TL;DR

AAAI2017的一篇文章。
主要通過分類和排序模型結合解決二者各自單獨使用存在的問題,並且使用跨領域結構,通過複用其他數據集進行輔助訓練,提供了一種解決在該任務下數據量少的思路。

Algorithm

模型框架如下:
在這裏插入圖片描述

  • 在排序部分,論文采用的是三元組的策略,通過構造anchor/positive/negative,直接構造全連接來優化排序特徵。
  • 在分類部分,首先將三元組組合成positive pair和negative pair,送到第三個卷積層得到joint feature map,之後可以通過分類的損失函數訓練。
  • 在跨領域訓練部分,對兩個圖像對的label作XNOR操作作爲Contrastive loss的label,當兩個圖像對相同時,拉近兩個數據集的joint feature map,反之則拉遠兩個feature map。損失函數如下:
    用同或計算狀態是否吻合:
    在這裏插入圖片描述
    Contrastive loss:
    在這裏插入圖片描述

Experiment Results

在這裏插入圖片描述
Multi vs. single task: 對比了測試使用rank loss、訓練只用binary logistic classification loss或者triplet loss性能。
Cross-domain architecrue: 使用CUHK03作爲源數據,將其他四個小數據集作爲目標數據集進行實驗。

Thoughts

Multi-task的思路很容易想到,但是cross-domain是個非常好的解決訓練數據少並且分佈不均的問題。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章