17日前

キーポイント表現の再考:マルチペルソングループの人体ポーズ推定におけるキーポイントとポーズをオブジェクトとしてモデル化する

William McNally, Kanav Vats, Alexander Wong, John McPhee
キーポイント表現の再考:マルチペルソングループの人体ポーズ推定におけるキーポイントとポーズをオブジェクトとしてモデル化する
要約

ヒューマンポーズ推定をはじめとするキーポイント推定タスクにおいて、ヒートマップベースの回帰手法が主流であるものの、明確な欠点を有している。すなわち、ヒートマップは本質的に量子化誤差を抱え、生成および後処理に膨大な計算コストを要する。より効率的な解決策の探求を動機として、本研究では個々のキーポイントおよび空間的に関連するキーポイントの集合(すなわちポーズ)を、密な単段階アンカー付き検出フレームワーク内の「オブジェクト」としてモデル化する手法を提案する。このため、本手法を「KAPAO(カ・ポウ)」と命名する。KAPAOは、単段階の多人数ヒューマンポーズ推定問題に適用され、ヒューマンポーズとキーポイントオブジェクトを同時に検出し、検出結果を統合することで、両者のオブジェクト表現の利点を活かす。実験の結果、KAPAOはヒートマップの後処理に大きく依存する従来手法に比べ、高速かつ高精度であることが確認された。特に、テスト時増強(test-time augmentation)を使用しない実用的な設定において、精度と速度のトレードオフが顕著に有利である。ソースコード:https://github.com/wmcnally/kapao

キーポイント表現の再考:マルチペルソングループの人体ポーズ推定におけるキーポイントとポーズをオブジェクトとしてモデル化する | 最新論文 | HyperAI超神経