A Pose-Sensitive Embedding for Person Re-Identification with Expanded Cross Neighborhood Re-Ranking

兩點值得關注:
①解決視角多變
粗略姿勢+精細姿勢結合的方法
粗魯姿勢即通過相機視角捕獲的幾種情況進行分析,分正面、背面、側面三種類別,加一個softmax做分類,用作視角預測。這算是對預測ID提供一個粗略的幫助。
精細姿勢就是熟知的骨架關鍵點,利用人體的關節信息去做一個精細的判斷。這裏提到用的是Deepcut模型提取關節點信息,值得一看。【Deepercut: A deeper, stronger, and faster multiperson pose estimation model,2016】
②一種重排序方法
與之前ZZ那篇效果差不多,這裏使用到一種擴展領域交叉距離的概念,公式太多,難理解。不過,ZZ的re-ranking算是學術界常用的,以後有機會蒐集re-ranking系列,對結果的提升起碼能到4%左右吧!
在這裏插入圖片描述
17指的是14個關鍵點分別作爲一個通道以及3個RGB通道一起輸入網絡。最終根據feature map的帶有關鍵點的置信圖去做一個視角的分類,即人體的朝向預測,指導最後的id預測。我覺得應該可以加一個ROI區域,除了分類損失,將這個ROI分支做三元組損失計算,一方面這個ROI可以達到分塊方法的效果,即根據關鍵點信息界定頭部、上身以及下身的檢測框區域隨後提取部位局部特徵的信息,還能做一個類間類內的度量量化,算是細化的重排。
端正姿態真的很重要~

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章