1ヶ月前

高速かつ堅牢な動的手ジェスチャ認識手法:キーフレーム抽出と特徴量融合を用いて

Hao Tang; Hong Liu; Wei Xiao; Nicu Sebe
高速かつ堅牢な動的手ジェスチャ認識手法:キーフレーム抽出と特徴量融合を用いて
要約

ジェスチャ認識は、コンピュータビジョンとパターン認識の分野において注目を集めている重要なトピックであり、自然な人間とコンピュータのインターフェースにおいて極めて重要な役割を果たしています。最近では大きな進歩が見られますが、高速かつ堅牢な手のジェスチャ認識は依然として未解決の問題となっています。既存の手法は、性能と効率性を同時に十分にバランス良く保つことができていないためです。この課題を克服するために、本研究では画像エントロピーと密度クラスタリングを組み合わせて、手のジェスチャビデオからキーフレームを抽出し、さらなる特徴量抽出を行う方法を提案します。これにより認識の効率性が向上します。さらに、特徴量融合戦略も提案され、これにより特徴量表現が改善され、認識性能が向上します。当方針の実用的な環境(「野生」環境)での有効性を検証するため、HandGestureおよびAction3Dという2つの新しいデータセットを導入しました。実験結果は一貫して、当方針がNorthwestern University(ノースウェスタン大学)、Cambridge(ケンブリッジ)、HandGestureおよびAction3Dの手のジェスチャデータセットで競争力のある結果を達成していることを示しています。当方針に関連するコードとデータセットは、https://github.com/Ha0Tang/HandGestureRecognition で公開されます。注:「野生」環境とは、「wild」環境を日本語に直訳したものです。これは一般的には「実世界」や「実際の使用状況」といった意味で使われます。ただし、「野生」の方が原文に近いため採用しました。