【Person Re-ID】Deep Representation Learning with Part Loss for Person Re-Identification

paper下載地址:https://arxiv.org/abs/1707.00798

Introduction

Person Re-ID需要解決什麼問題?
測試集中的人在訓練集中是不可見的,因此需要學習到的描述子有足夠的可分性。

目前大多數表徵學習方法的目的是最小化訓練集的分類損失,這與Re-ID任務不同。表徵學習方法更多的關注於人體的軀幹部分,而忽略其他部分。對於不同的人,其他部分諸如頭部,上半身體依然是意義的。基於此,作者提出了PL-net(part loss networks),它自動將一副圖像分成K個parts,然後分別計算每個parts的分類損失。

Approach

整個網絡主要包括兩個部分:訓練集的經驗分類損失即全局損失,表徵學習損失即各個部件的分類損失。

假設已經得到feature map χ ,首先計算每個特徵圖的激活值的最大值位置,

(hz,wz)=argmaxχz(h,w)

其中z 爲通道數,然後用L2 距離將這些座標點(h,w) 聚成K類。然後在每個聚類中用average pooling(聚類中的通道上)並min-max歸一化得到顯著性圖像。然後用閾值0.5將顯著性圖像變爲二值圖像,並將二值圖的最大外接矩形作爲人體部件的bounding box。

有了bounding box,有了feature mapχ ,接下來就是RoI pooling,將χ 轉爲固定的大小χkRZHW ,其中H=W=4 ,最後就是和全局損失一樣計算各個部件的損失。

測試的時候,全局特徵用χ 加上global pooling之後的特徵,局部特徵用χkRZ44 加上global pooling之後的特徵,然後將所有的特徵concat起來。

Experiment

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章