Command Palette
Search for a command to run...
空間注意機構を備えた3Dグラフ畳み込みニューラルネットワークを用いた手話認識
空間注意機構を備えた3Dグラフ畳み込みニューラルネットワークを用いた手話認識
概要
聴覚障がい者にとって、手話は他者とコミュニケーションを図る主要な手段である。手話は、手の動きや非手の動き(非手的パラメータ)といった構造的に高度に整った要素を視覚的に伝える言語であり、聴覚能力を持つ人々がこれを習得するには多大な努力を要する。手話認識技術は、こうした習得の難しさを軽減し、聴覚障がい者と健常者との間のコミュニケーションギャップを埋める目的を有する。本研究では、畳み込み型グラフニューラルネットワーク(GCN)を基盤とした効率的な手話認識アーキテクチャを提案する。提案アーキテクチャは、空間的注意メカニズムにより強化された少数の可分3DGCN層から構成されており、深層グラフニューラルネットワークでよく見られる過度な平滑化(over-smoothing)問題を回避できる。さらに、注意メカニズムにより、ジェスチャーの空間的文脈表現が向上している。本アーキテクチャは複数のデータセット上で評価され、優れた性能を示した。