論文閱讀(九)Attention-Aware Compositional Network for Person Re-identification

Abstract

作者提出,姿態信息沒有被好好的利用到行人再識別中,於是提出了Attention-Aware Compositional Network (AACN)模型。AACN包含兩部分:(1)Pose-guided Part Attention (PPA),通過學習掩蓋背景部分。(2)Attention-aware Feature Composition (AFC),通過pose-guided visibility scores估計身體哪部分被遮擋。

1. Introduction

Pose-guided Part Attention(PPA)是一個置信圖,可以精確捕捉目標區域同時去除背景區域。將這置信圖當作一種掩模,應用在特徵圖上,那麼AFC部分就可以提取出局部區域對齊的特徵。

本文貢獻:

1、提出AACN模型處理錯位與遮擋問題

2、使用PPA預測局部區域,去除背景干擾。

3、引入可見性分數 (visibility scores)來測量每個身體部位的遮擋程度,他爲注意力感知特徵組合(Attention-aware Feature
Composition.)提供了圖像特定區域的重要性分數

4、在數據集上的多個實驗

Attention-Aware Compositional Network

AACN包含兩部分PPA與AFC。

PPA是一個兩階段三分支的模塊,生成關鍵點置信圖,剛性區域與非剛性區域的attention maps。根據局部區域attention maps進一步預測visibility scores。

AFC分爲三個階段,第一階段使用GoogleNet生成全局特徵。第二階段,依賴PPA生成的局部區域attention map,用attention map去掩蓋全局特徵,接着第三階段再與visibility score加權融合,最終生成一個1024維的向量。

Pose-guided Part Attention

受multi-stage CNN人體姿態估計的啓發,PPA採用兩階段設計,第一階段分別預測非剛性區域attention N 與剛性區域attention R與關鍵點置信圖K。第二階段微調attention maps。

attention map中的強度表示區域的可見性,可以獲得visibility score。

Attention-aware Feature Composition

AFC包含三個階段,Global Context Network (GCN), Attention-Aware Feature Alignment, and Weighted Feature Composition。

第一階段使用GoogleNet提取全局特徵。

第二階段基於第一階段的全局特徵,並結合PPA的attention map來生成part-attention-aware features。

第三階段使用visibility score加權融合第二階段的features,可見區域權重大。

 

 

 

 

 

 

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章