Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields 閱讀筆記

原創

来路与归途

2020-07-04 00:55

CVPR 2017

Code: https://github.com/ZheC/Realtime_Multi-Person_Pose_Estimation

摘要

論文提出一個高效的檢測一張圖片中的多個人的姿態的方法，該方法使用非參數的方法（Part Affinity Fields）來學習將圖像中的每個人的各個部位連接爲一個整體。

該結構對全局上下文進行編碼，自下而上的解析方式來同時獲取高的精度和實時檢測；

簡介

推斷圖像中多個人的姿態，存在一系列的挑戰：

1.每張圖像中待檢測人體的個數不確定

2.人體之間的遮擋使得將各個關鍵點連接爲一個整體比較困難

3.檢測時間隨着圖像中人數的增加而增加，很難達到實時檢測

檢測方法分類：

Top-down :

首先進行人體檢測，然後對檢測出的人體進行姿態估計；

缺點：1.人體檢測失敗，則姿態估計就失敗

2.檢測時間與檢測人體個數成比例，很難做到實時

Bottom-up :

2.方法

首先.通過前饋網絡同時生成一系列的身體部位的2D conﬁdence maps S（如圖b）和身體部位的親和力的2D vector ﬁelds L（如圖c）

然後.通過推斷方式將conﬁdence maps S和 afﬁnities fields生成圖像中所有人的關鍵點（如圖d）

2.1同時檢測和關聯

網絡結構由兩個分支組成：

一個生成conﬁdence maps S；

另一個生成afﬁnities fields L；

首先，通過卷積神經網絡（VGG-19，，初始化網絡，並進行微調）生成一系列特徵圖F;

然後，通過構建的網絡生成一系列S1和L1,

接下來每個階段的輸入，都是前一階段的輸出St-1、Lt-1和特徵圖F的組合

每階段的兩個分支都對應不同的損失函數（L2 loss）：

通過損失函數加權來解決一些數據集未對所有的人進行標註的問題；

2.2 conﬁdence maps標籤（生成關鍵點標籤）

首先生成個人conﬁdence maps：（高斯函數）（每一個人的一個部位關鍵點對應一個波峯）

:人體k的身體部位j的位置

P: σ:控制波峯的寬度

然後，生成conﬁdence maps標籤

2.3 afﬁnities fields標籤（將關鍵點通過可靠的方法連接爲本該屬於的人體中）

關鍵點方向向量：

爲單位向量

關鍵點應該落在身體部位內（通過以下公式限定）

：身體部位l的像素寬度；:身體部位的長度

將k個人在位置p的非零向量求平均，作爲標籤

2.4使用PAFs進行多人解析

通過NMS獲取afﬁnities fields的離散集合；一張圖片有多個人，所以對於每個身體部位有多個候選點；

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields 閱讀筆記

摘要

簡介

2.方法

HTML頁面關於高分屏的設置

druid數據源 xml配置

支持度、置信度和提升度

python文檔壓縮與解壓——zipfile

Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields 閱讀筆記

n-gram語言模型

U-Net: Convolutional Networks for Biomedical Image Segmentation閱讀筆記

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結