17日前

InsPose:シングルステージ多人物ポーズ推定のためのインスタンス認識ネットワーク

Dahu Shi, Xing Wei, Xiaodong Yu, Wenming Tan, Ye Ren, Shiliang Pu
InsPose:シングルステージ多人物ポーズ推定のためのインスタンス認識ネットワーク
要約

複数人ポーズ推定は魅力的でありながらも、挑戦的なタスクである。従来の手法は主に2段階フレームワークに基づいており、トップダウン型とボトムアップ型に大別される。2段階手法は、追加の人物検出器による高い計算リソースの浪費を抱えるか、すべてのインスタンスに依存しないキーポイントを予測した後にヒューリスティックにキーポイントをグループ化する必要があるという課題を有している。一方、単段階アプローチは、複数人ポーズ推定のパイプラインを簡素化することを目指し、近年注目を集めている。しかし、最近の単段階手法は、単一の特徴ベクトルから多様な全身ポーズを回帰する困難さから、性能が低いという限界を抱えている。これまでの手法が複雑なヒューリスティック設計を導入していたのに対し、本研究ではインスタンスに依存する動的ネットワークを用いることで、シンプルでありながら効果的な解決策を提案する。具体的には、各インスタンスに対してネットワークパラメータの一部を適応的に調整するインスタンスに依存するモジュールを設計した。このアプローチにより、さまざまなポーズを認識するためのネットワークの表現力と適応性を顕著に向上させつつ、コンパクトなエンドツーエンド学習可能なパイプラインを維持できる。MS-COCOデータセットにおける広範な実験の結果、本手法は既存の単段階手法に対して顕著な性能向上を達成し、最先端の2段階アプローチと比較して、精度と効率のバランスをより優れたものにしている。コードおよびモデルは、\url{https://github.com/hikvision-research/opera} で公開されている。

InsPose:シングルステージ多人物ポーズ推定のためのインスタンス認識ネットワーク | 最新論文 | HyperAI超神経