2ヶ月前

野生環境下での高精度な多人物姿勢推定

George Papandreou; Tyler Zhu; Nori Kanazawa; Alexander Toshev; Jonathan Tompson; Chris Bregler; Kevin Murphy
野生環境下での高精度な多人物姿勢推定
要約

私たちは、複数人の検出と2次元姿勢推定のための方法を提案し、困難なCOCOキーポイントタスクにおいて最先端の結果を達成しています。この方法は単純でありながら強力で、トップダウンアプローチとして2つの段階から構成されています。第1段階では、人が含まれている可能性のあるボックスの位置とスケールを予測します。これにはFaster R-CNN検出器を使用します。第2段階では、各提案されたバウンディングボックスに潜在的に含まれる人物のキーポイントを推定します。各キーポイントタイプに対して、完全畳み込みResNetを使用して密集したヒートマップとオフセットを予測します。これらの出力を組み合わせるためには、新しい集約手順を導入し、高精度なキーポイント予測を得ています。さらに、粗いボックスレベルのNMS(Non-Maximum Suppression)ではなく、新しい形式のキーポイントベースのNMSを使用し、ボックスレベルのスコアリングではなく、新しい形式のキーポイントベースの信頼度スコア推定を行っています。COCOデータのみで学習させた最終システムは、COCOテストデベロップメントセットにおいて平均精度0.649を達成し、テストスタンダードセットにおいて0.643を達成しており、2016年のCOCOキーポイントチャレンジ優勝者や他の最近の最先端手法よりも優れた性能を示しています。さらに、社内でラベル付けされた追加データを使用することで、テストデベロップメントセットでの平均精度が0.685に向上し、テストスタンダードセットでは0.673となりました。これは同じデータセット上で以前最も高性能だった手法と比較して5%以上の絶対的な改善となっています。

野生環境下での高精度な多人物姿勢推定 | 最新論文 | HyperAI超神経