
要約
多人姿勢推定は困難な課題である。最新の人物検出器は優れた性能を示しているが、位置特定や認識に小さな誤差が避けられない。これらの誤差により、単一人物姿勢推定器(Single-Person Pose Estimator: SPPE)が失敗する可能性があり、特に人物検出結果のみに依存する方法では顕著である。本論文では、不正確な人物バウンディングボックスが存在する場合の姿勢推定を容易にする新しい地域多人物姿勢推定(Regional Multi-Person Pose Estimation: RMPE)フレームワークを提案する。当該フレームワークは3つの構成要素から成る:対称空間変換ネットワーク(Symmetric Spatial Transformer Network: SSTN)、パラメトリックポーズ非最大値抑制(Parametric Pose Non-Maximum-Suppression: NMS)、およびポーズガイダンス提案生成器(Pose-Guided Proposals Generator: PGPG)。当手法は不正確なバウンディングボックスと冗長な検出を処理でき、MPII(複数人物)データセットにおいて最新手法よりもmAPで17%の向上を達成した。我々のモデルとソースコードは公開されている。