
要約
3次元人体ポーズ推定は人工知能分野における基本的な課題であり、拡張現実(AR)/仮想現実(VR)、ヒューマンコンピュータインタラクション(HCI)、ロボティクスなど幅広い分野に応用されている。しかし、従来の手作業で設計された点群サンプリング手法および単一フレームに基づく推定戦略により、点群からの人体ポーズ推定はノイズを含む点や推定結果のゆらぎ(ジッター)といった課題に直面している。本論文では、点群シーケンスからの3次元人体ポーズ推定に新たなアプローチを提案する。入力点群から有効な点群を抽出するために、密度誘導型アテンション機構に基づく微分可能な点群サンプリング手法を設計した。また、従来の3次元人体ポーズ推定で生じるジッターを回避するため、時間的な情報を活用し、より安定した推定結果を得ることを実現した。ITOPデータセットおよびNTU-RGBDデータセットにおける実験結果から、本研究で提案する各構成要素の有効性が確認され、最先端の性能を達成することが示された。