16日前

3次元骨格データからの人間の行動認識のためのローリング回転

{Rama Chellappa, Raviteja Vemulapalli}
3次元骨格データからの人間の行動認識のためのローリング回転
要約

最近、深度センサの普及およびリアルタイムで3Dスケルトンを推定するアルゴリズムの進展に伴い、骨格に基づく人間の行動認識は、さまざまな研究分野から注目を集めている。本研究では、3Dスケルトンデータから人間の行動を認識するためにローリングマップ(rolling map)を用いる。ローリングマップは、数学的に明確に定義された概念であり、視覚分野での応用はまだほとんど検討されていない。まず、各スケルトンを体部間の相対的な3D回転で表現する。3D回転は特殊直交群 SO(3) の要素であるため、本研究のスケルトン表現は、Lie群 SO(3) × … × SO(3) の点として定式化され、これはリーマン多様体としても構成される。次に、この表現を用いて、人間の行動をこのLie群内の曲線としてモデル化する。しかし、非ユークリッド空間における曲線の分類は困難であるため、対象の行動曲線を、Lie代数 so(3) × … × so(3)(ベクトル空間)に、対数写像とローリングマップを組み合わせて展開(unwrap)し、その上で分類処理を行う。3つの行動データセットにおける実験結果から、提案手法が最先端手法と同等またはそれ以上の性能を発揮することが示された。

3次元骨格データからの人間の行動認識のためのローリング回転 | 最新論文 | HyperAI超神経