16日前
Faster VoxelPose:正射投影を用いたリアルタイム3D人体ポーズ推定
Hang Ye, Wentao Zhu, Chunyu Wang, Rujie Wu, Yizhou Wang

要約
ボクセルベースの手法は、複数カメラからのマルチプレイヤー3Dポーズ推定において有望な成果を上げているが、特に大規模なシーンにおいて計算負荷が重くなるという課題を抱えている。本研究では、特徴ボリュームを3つの2次元座標平面に再投影し、それぞれからX、Y、Z座標を別々に推定することで、この課題に取り組む「Faster VoxelPose」を提案する。具体的には、まずxy平面に投影されたボリューム特徴とz軸方向の特徴に基づき、2次元ボックスとその高さを推定することで、各人物を3次元バウンディングボックスで局所化する。その後、各人物について、3つの座標平面からそれぞれ部分的な関節座標を独立して推定し、それらを統合することで最終的な3Dポーズを算出する。本手法は高コストな3D-CNNを必要とせず、VoxelPoseの処理速度を10倍向上させつつ、最先端の手法と同等の精度を達成した。これにより、リアルタイム応用における潜在的な有効性が実証された。