人体姿态估计——CPMs

论文:《Convolutional Pose Machines 》

1.概述

CPMs由一系列预测器组成,这些预测器经过训练,可在每个图像位置进行密集预测。
本文的主要贡献包含:
a:使用级联(sequential)卷积结构学习隐式空间模型。
b:系统地设计和训练CPMs来学习图像特征和依赖图像的空间模型(各个关节的关系)

2.CPMs的模型架构

在这里插入图片描述
CPM采用CNN的方式来进行特征提取和上下文信息提取,以heatmap的形式表示预测结果(能够保留空间信息),在全卷积的结构下使用中间监督进行端到端的训练和测试,极大提高了关键点检测的准确率。
Heatmap的好处: 在于空间位置信息的保存,这个非常重要。一方面,可以保留multi-modal的信息,比如没有很好的context信息的情况下,是很难区分左右手的,所以图片中左右手同时都可能有比较好的响应,这种heatmap的形式便于后续的cascade进行refinement优化。另外一个方面,人体姿态估计这个问题本身的自由度很大,直接regression的方式对自由度小的问题比如人脸landmark是比较适合的,但是对于自由度大的姿态估计问题整体的建模能力会比较弱。相反,heatmap是比较中间状态的表示,所以信息的保存会更丰富。

3.参考
https://zhuanlan.zhihu.com/p/102468356
https://blog.csdn.net/shenxiaolu1984/article/details/51094959
https://zhuanlan.zhihu.com/p/56131599
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章