Horizontal Pyramid Matching for Person Re-identification論文閱讀

paper:https://arxiv.org/abs/1804.05275

code:https://github.com/OasisYang/HPM

題外話:論文在梳理Related Work的格式值得學習,很有條理性。

摘要:儘管行人重識別最近取得了明顯進展,但是當有明顯區分性的身體部件缺失的時候,當前大多數算法仍然會失效。爲了改善這種情況,我們提取了一種簡單且有效的水平金字塔匹配的方法來充分利用圖像行人的各種部件信息。這樣即使在行人圖像缺少某些關鍵部分時,仍然可以正確識別候選人員。在Horizontal Pyramid Matching(HPM)中,我們在提取更健壯行人特徵向量方面做出瞭如下的貢獻:1. 在學習階段,我們讓不同水平金字塔尺度的部分特徵向量進行分類,可以增強不同行人局部特徵的識別能力。2. 我們利用平均值和最大值池化的策略,以全局-局部結合的方式考慮特定於行人的顯著信息。爲了驗證提取的HPM方法的有效性,我們在三個公開數據集上做了大量的實驗,分別在Market-1501、DukeMTMC-ReID和CUHK03取得了MAP爲83.1%,74.5% 和 59.7%,實現了SOTA。

 

                                                

知識點簡述:我們通過在最終的特徵圖上施加水平硬分割,分別將特徵圖劃分爲1、2、4、8個水平塊(將特徵圖複製4份,分分別進行操作)。其中在1分支上進行全局最大值池化,在2、4和8的分支的各個水平塊上進行全局平均值池化(看代碼)。在訓練時,分別對(1+2+4+8)個256維度的特徵向量進行分類,採用Cross Entropy Loss損失函數進行監督。在測試時,對(1+2+4+8)個256維度特徵向量進行整合,組成行人圖像的特徵向量,代表對應行人。

 

分析:論文中,最終生成的特徵圖爲(Batch, 2048, 24, 8),將此特徵圖分別分成1、2、4和8個水平塊,分別在以上水平塊上同時施加全局平均值池化和全局最大值池化,將池化後的特徵圖相加融合,進行降維以降低運算(但是作者開源的代碼並沒有實現以上操作)。關於全局平均值池化和全局最大值池化,論文也做了說明。全局平均值池化是許多分類算法中較多采用的傳統操作,因爲全局平均值池化操作強制將特徵圖和類別進行對應。但是全局平均值池化會導致一些顯著信息由於平均而丟失。因此我們同時對水平塊採用均值和最大值池化方式,這樣既能保持全局關係,又能保留判別部分。論文通過將特徵圖分成1、2、4和8個水平塊,一共爲15個水平塊。分別對以上水平塊進行分類,利用Cross Entropy Loss進行監督。可知15個損失函數過於多,會導致難以收斂。

 

 

結論:論文將特徵圖分成1、2、4和8個分支,可以使網絡格外關注行人圖像的局部信息。但是過多的分支會致使網絡難以收斂。

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章