Paper Reading Note
URL:
https://arxiv.org/pdf/1607.05369.pdf
TL;DR
AAAI2017的一篇文章。
主要通過分類和排序模型結合解決二者各自單獨使用存在的問題,並且使用跨領域結構,通過複用其他數據集進行輔助訓練,提供了一種解決在該任務下數據量少的思路。
Algorithm
模型框架如下:
- 在排序部分,論文采用的是三元組的策略,通過構造anchor/positive/negative,直接構造全連接來優化排序特徵。
- 在分類部分,首先將三元組組合成positive pair和negative pair,送到第三個卷積層得到joint feature map,之後可以通過分類的損失函數訓練。
- 在跨領域訓練部分,對兩個圖像對的label作XNOR操作作爲Contrastive loss的label,當兩個圖像對相同時,拉近兩個數據集的joint feature map,反之則拉遠兩個feature map。損失函數如下:
用同或計算狀態是否吻合:
Contrastive loss:
Experiment Results
Multi vs. single task: 對比了測試使用rank loss、訓練只用binary logistic classification loss或者triplet loss性能。
Cross-domain architecrue: 使用CUHK03作爲源數據,將其他四個小數據集作爲目標數據集進行實驗。
Thoughts
Multi-task的思路很容易想到,但是cross-domain是個非常好的解決訓練數據少並且分佈不均的問題。