要約
本稿では、エゴセントリック視点から物体と相互作用する手のポーズ推定という問題に取り組む。この状況では、物体による手の部位の頻繁な遮蔽や、手自体の自己遮蔽が生じるため、推定が困難となる。本研究では、ボクセル対ボクセル(Voxel-to-Voxel)アプローチを用いて手関節位置の候補を取得し、これらの候補をアンサンブル化した上で、複数の後処理戦略を適用して結果を向上させる。さらに、事前知識としての手ポーズモデル(Truncated Singular Value Decomposition: SVD)と時間的文脈を活用することで、より精密な手関節位置を推定する。本手法の有効性を検証するため、後処理における各特徴の影響を評価するアブレーションスタディを実施した。その結果、HANDS19チャレンジ:タスク2(物体と相互作用する際の深度ベース3D手ポーズ推定)において、最新の性能を達成し、未知のテストデータに対する精度は33.09 mmを達成した。