要約
骨格に基づく人間の行動認識は、人間-コンピュータインタラクションやインテリジェント監視など幅広い応用が期待されている。しかし、視点の変化やノイズの多いデータがこのタスクに大きな課題をもたらしている。さらに、時空間的な骨格シーケンスを効果的に表現する手法の確立は、依然として未解決の問題である。本研究では、これらの課題を一括して解決する目的で、視点不変性を実現する強化された骨格可視化手法を提案する。本手法は3段階のプロセスから構成される。第一段階では、骨格関節の時空間的位置に及ぼす視点変化の影響を除去するため、シーケンスベースの視点不変変換を考案した。第二段階では、変換された骨格を色画像の系列として可視化し、関節の時空間情報を暗黙的に表現する。さらに、色画像に対して視覚的・運動的強化手法を適用することで、局所パターンの特徴を強化した。第三段階では、畳み込みニューラルネットワーク(CNN)を用いて、色画像から堅牢かつ判別力の高い特徴を抽出する。得られた深層特徴は、決定段階での統合により最終的な行動クラススコアを生成する。4つの困難なデータセットにおける広範な実験により、本手法の優れた性能が一貫して確認された。