介紹
二維圖像中的多人pose估計是理解人類行爲的一項重要技術。
本文提出了一種基於輸入圖像和輸入位姿元組的人體pose refine網絡,用在pose估計post processing中,調整pose估計的結果,(類似NMS使用重疊可能有假陽結果的先驗,調整置信度)
而文章所用的先驗是:在以往的方法中,位姿的細化主要是通過端到端可訓練的多階段體系結構來實現的。如PAF,EPAF,Hourglass 根據最近的研究,目前最先進的二維人體姿態估計方法具有相似的誤差分佈:
文章使用這個誤差統計信息作爲先驗信息來生成合成的姿態
使用合成的錯誤姿態和GT來訓練的pose refine模型。
在測試階段,任何其他方法的位姿估計結果都可以輸入到該方法中。
此外,所提出的模型不需要代碼或其他方法的知識,這使得它可以方便地在後處理步驟中使用。
結果表明,該方法比傳統的多階段優化模型具有更好的性能,並在常用基準上不斷改進各種最先進的位姿估計方法的性能。
我們將發佈易於訪問的代碼和預先培訓的模型。