HyperAIHyperAI

Command Palette

Search for a command to run...

InsPose:シングルステージ多人物ポーズ推定のためのインスタンス認識ネットワーク

Dahu Shi Xing Wei Xiaodong Yu Wenming Tan Ye Ren Shiliang Pu

概要

複数人ポーズ推定は魅力的でありながらも、挑戦的なタスクである。従来の手法は主に2段階フレームワークに基づいており、トップダウン型とボトムアップ型に大別される。2段階手法は、追加の人物検出器による高い計算リソースの浪費を抱えるか、すべてのインスタンスに依存しないキーポイントを予測した後にヒューリスティックにキーポイントをグループ化する必要があるという課題を有している。一方、単段階アプローチは、複数人ポーズ推定のパイプラインを簡素化することを目指し、近年注目を集めている。しかし、最近の単段階手法は、単一の特徴ベクトルから多様な全身ポーズを回帰する困難さから、性能が低いという限界を抱えている。これまでの手法が複雑なヒューリスティック設計を導入していたのに対し、本研究ではインスタンスに依存する動的ネットワークを用いることで、シンプルでありながら効果的な解決策を提案する。具体的には、各インスタンスに対してネットワークパラメータの一部を適応的に調整するインスタンスに依存するモジュールを設計した。このアプローチにより、さまざまなポーズを認識するためのネットワークの表現力と適応性を顕著に向上させつつ、コンパクトなエンドツーエンド学習可能なパイプラインを維持できる。MS-COCOデータセットにおける広範な実験の結果、本手法は既存の単段階手法に対して顕著な性能向上を達成し、最先端の2段階アプローチと比較して、精度と効率のバランスをより優れたものにしている。コードおよびモデルは、\url{https://github.com/hikvision-research/opera} で公開されている。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています