Horizontal Pyramid Matching for Person Re-identification论文阅读

paper:https://arxiv.org/abs/1804.05275

code:https://github.com/OasisYang/HPM

题外话:论文在梳理Related Work的格式值得学习,很有条理性。

摘要:尽管行人重识别最近取得了明显进展,但是当有明显区分性的身体部件缺失的时候,当前大多数算法仍然会失效。为了改善这种情况,我们提取了一种简单且有效的水平金字塔匹配的方法来充分利用图像行人的各种部件信息。这样即使在行人图像缺少某些关键部分时,仍然可以正确识别候选人员。在Horizontal Pyramid Matching(HPM)中,我们在提取更健壮行人特征向量方面做出了如下的贡献:1. 在学习阶段,我们让不同水平金字塔尺度的部分特征向量进行分类,可以增强不同行人局部特征的识别能力。2. 我们利用平均值和最大值池化的策略,以全局-局部结合的方式考虑特定于行人的显著信息。为了验证提取的HPM方法的有效性,我们在三个公开数据集上做了大量的实验,分别在Market-1501、DukeMTMC-ReID和CUHK03取得了MAP为83.1%,74.5% 和 59.7%,实现了SOTA。

 

                                                

知识点简述:我们通过在最终的特征图上施加水平硬分割,分别将特征图划分为1、2、4、8个水平块(将特征图复制4份,分分别进行操作)。其中在1分支上进行全局最大值池化,在2、4和8的分支的各个水平块上进行全局平均值池化(看代码)。在训练时,分别对(1+2+4+8)个256维度的特征向量进行分类,采用Cross Entropy Loss损失函数进行监督。在测试时,对(1+2+4+8)个256维度特征向量进行整合,组成行人图像的特征向量,代表对应行人。

 

分析:论文中,最终生成的特征图为(Batch, 2048, 24, 8),将此特征图分别分成1、2、4和8个水平块,分别在以上水平块上同时施加全局平均值池化和全局最大值池化,将池化后的特征图相加融合,进行降维以降低运算(但是作者开源的代码并没有实现以上操作)。关于全局平均值池化和全局最大值池化,论文也做了说明。全局平均值池化是许多分类算法中较多采用的传统操作,因为全局平均值池化操作强制将特征图和类别进行对应。但是全局平均值池化会导致一些显著信息由于平均而丢失。因此我们同时对水平块采用均值和最大值池化方式,这样既能保持全局关系,又能保留判别部分。论文通过将特征图分成1、2、4和8个水平块,一共为15个水平块。分别对以上水平块进行分类,利用Cross Entropy Loss进行监督。可知15个损失函数过于多,会导致难以收敛。

 

 

结论:论文将特征图分成1、2、4和8个分支,可以使网络格外关注行人图像的局部信息。但是过多的分支会致使网络难以收敛。

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章