2ヶ月前

混雑状況における姿勢推定の再考:検出情報ボトルネックと曖昧性の克服

Zhou, Mu ; Stoffl, Lucas ; Mathis, Mackenzie Weygandt ; Mathis, Alexander
混雑状況における姿勢推定の再考:検出情報ボトルネックと曖昧性の克服
要約

個体間の頻繁な相互作用は、姿勢推定アルゴリズムにとって基本的な課題となっています。現在のパイプラインでは、オブジェクト検出器と姿勢推定器を組み合わせて使用する(トップダウンアプローチ)か、まずすべての身体部位を局所化し、その後それらをリンクして個体の姿勢を予測する(ボトムアップアプローチ)方法が採用されています。しかし、個体が密接に相互作用すると、トップダウン手法は重複する個体のために定義が不明確になり、ボトムアップ手法は遠隔の身体部位との誤った接続を推定することがよくあります。そこで、我々はボトムアップとトップダウン手法の長所を組み合わせた新しいパイプラインである「ボトムアップ条件付きトップダウン姿勢推定(BUCTD)」を提案します。具体的には、ボトムアップモデルを使用して検出器として機能させることを提案します。このモデルは推定されたバウンディングボックスだけでなく、条件として注意ベースのトップダウンモデルに供給される姿勢提案も提供します。我々は動物および人間の姿勢推定ベンチマークで当方針の性能と効率性を示しています。CrowdPoseおよびOCHumanにおいて、従来の最先端モデルよりも大幅に優れた結果を得ています。CrowdPoseでは78.5 AP、OCHumanでは48.5 APを達成しており、それぞれ従来技術に対して8.6%と7.8%の改善となっています。さらに、魚やサルなどの多種類動物ベンチマークでの性能向上も確認しています。コードは https://github.com/amathislab/BUCTD で公開されています。

混雑状況における姿勢推定の再考:検出情報ボトルネックと曖昧性の克服 | 最新論文 | HyperAI超神経