2ヶ月前

CrowdPose: 混雑シーンにおける効率的な姿勢推定と新しいベンチマーク

Jiefeng Li; Can Wang; Hao Zhu; Yihuan Mao; Hao-Shu Fang; Cewu Lu
CrowdPose: 混雑シーンにおける効率的な姿勢推定と新しいベンチマーク
要約

多人姿勢推定は多くのコンピュータビジョンタスクの基礎であり、近年大きな進歩を遂げています。しかし、これまでの方法の多くは混雑したシーンにおける姿勢推定の問題を十分に探究しておらず、この課題は多くの状況で避けて通れないものとなっています。さらに、現在のベンチマークではこのようなケースに対する適切な評価が提供されていません。本論文では、混雑したシーンでの姿勢推定問題を解決する新しいかつ効率的な手法と、アルゴリズムをより適切に評価するための新データセットを提案します。我々のモデルは2つの主要な構成要素から成り立っています:関節候補単一人姿勢推定(Single Person Pose Estimation: SPPE)と全関節最大値アソシエーションです。各関節に対して複数ピーク予測を行い、グラフモデルを使用して全アソシエーションを行うことで、我々の手法は混雑したシーンでの避けられない干渉に対して堅牢であり、推論も非常に効率的です。提案手法はCrowdPoseデータセットにおいて最新手法を5.2 mAP上回り、MSCOCOデータセットでの結果は我々の手法の汎化能力を示しています。ソースコードとデータセットは公開される予定です。

CrowdPose: 混雑シーンにおける効率的な姿勢推定と新しいベンチマーク | 最新論文 | HyperAI超神経