16日前

Faster VoxelPose:正射投影を用いたリアルタイム3D人体ポーズ推定

Hang Ye, Wentao Zhu, Chunyu Wang, Rujie Wu, Yizhou Wang
Faster VoxelPose:正射投影を用いたリアルタイム3D人体ポーズ推定
要約

ボクセルベースの手法は、複数カメラからのマルチプレイヤー3Dポーズ推定において有望な成果を上げているが、特に大規模なシーンにおいて計算負荷が重くなるという課題を抱えている。本研究では、特徴ボリュームを3つの2次元座標平面に再投影し、それぞれからX、Y、Z座標を別々に推定することで、この課題に取り組む「Faster VoxelPose」を提案する。具体的には、まずxy平面に投影されたボリューム特徴とz軸方向の特徴に基づき、2次元ボックスとその高さを推定することで、各人物を3次元バウンディングボックスで局所化する。その後、各人物について、3つの座標平面からそれぞれ部分的な関節座標を独立して推定し、それらを統合することで最終的な3Dポーズを算出する。本手法は高コストな3D-CNNを必要とせず、VoxelPoseの処理速度を10倍向上させつつ、最先端の手法と同等の精度を達成した。これにより、リアルタイム応用における潜在的な有効性が実証された。

Faster VoxelPose:正射投影を用いたリアルタイム3D人体ポーズ推定 | 最新論文 | HyperAI超神経