9日前

UniPose:単一画像および動画における統一的な人体ポーズ推定

Bruno Artacho, Andreas Savakis
UniPose:単一画像および動画における統一的な人体ポーズ推定
要約

我々は、「ウォーターフォール(Waterfall)」アトラス空間プーリング構造を基盤とする統合型フレームワークであるUniPoseを提案する。本手法は、複数のポーズ推定指標において最先端の性能を達成している。従来のポーズ推定手法は、標準的なCNNアーキテクチャを用いる場合、関節位置の推定において統計的手法や事前に定義されたアンカー・ポーズに大きく依存している。一方、UniPoseは、コンテキストセグメンテーションと関節位置推定を統合的に処理することで、単一段階の推論で高精度な人体ポーズ推定を実現しており、統計的手法に依存しない。UniPoseにおけるウォーターフォールモジュールは、カスケード構造における段階的フィルタリングの効率性を活かしつつ、空間ピラミッド構成と同等のマルチスケールの視野を維持している。さらに、本手法は多フレーム処理に対応するUniPose-LSTMへと拡張され、動画における時間的ポーズ推定においても最先端の成果を達成している。複数のデータセットにおける実験結果から、ResNetをバックボーンとし、ウォーターフォールモジュールを組み合わせたUniPoseは、単一人物のポーズ検出において、単一画像および動画の両方で優れた精度と効率性を兼ね備えた堅牢なアーキテクチャであることが示された。

UniPose:単一画像および動画における統一的な人体ポーズ推定 | 最新論文 | HyperAI超神経