11日前

VoxelPose:野生環境下におけるマルチカメラ3D人体ポーズ推定へ向けて

Hanyue Tu, Chunyu Wang, Wenjun Zeng
VoxelPose:野生環境下におけるマルチカメラ3D人体ポーズ推定へ向けて
要約

複数のカメラ視点から複数人の3次元姿勢を推定する手法を提案する。従来の手法は、ノイズが多く不完全な2次元姿勢推定に基づいて視点間の対応関係を構築する必要があったが、本手法は2次元空間での誤った判断を回避するため、3次元空間で直接処理を行うエンド・トゥ・エンドの解決策を提示する。この目的を達成するために、すべてのカメラ視点における特徴量を共通の3次元空間に変換・統合し、キュービッド提案ネットワーク(CPN)に供給することで、全人物の粗い位置を同時に推定する。その後、各提案に対して詳細な3次元姿勢を推定するため、ポーズ回帰ネットワーク(PRN)を提案する。本手法は実際の場面で頻発する隠蔽(オクルージョン)に対して堅牢である。装飾的な技術を一切用いずに、公開データセットにおいて最先端の手法を上回る性能を達成した。コードは https://github.com/microsoft/multiperson-pose-estimation-pytorch にて公開予定である。

VoxelPose:野生環境下におけるマルチカメラ3D人体ポーズ推定へ向けて | 最新論文 | HyperAI超神経