9日前

空間注意機構を備えた3Dグラフ畳み込みニューラルネットワークを用いた手話認識

{Hamid Ghaleb, Taha Alfakihm, Hamdi Altaheri, Mohammed Algabri, Mohammed Faisal, Hassan Mathkour, Tareq S. Alrayes, Yousef A. Alohali, Wadood Abdul, Mohamed Amine Mekhtiche, Ghulam Muhammad, Mansour Alsulaiman, Mohamed A. Bencherif, Muneer Al-Hammadi}
要約

聴覚障がい者にとって、手話は他者とコミュニケーションを図る主要な手段である。手話は、手の動きや非手の動き(非手的パラメータ)といった構造的に高度に整った要素を視覚的に伝える言語であり、聴覚能力を持つ人々がこれを習得するには多大な努力を要する。手話認識技術は、こうした習得の難しさを軽減し、聴覚障がい者と健常者との間のコミュニケーションギャップを埋める目的を有する。本研究では、畳み込み型グラフニューラルネットワーク(GCN)を基盤とした効率的な手話認識アーキテクチャを提案する。提案アーキテクチャは、空間的注意メカニズムにより強化された少数の可分3DGCN層から構成されており、深層グラフニューラルネットワークでよく見られる過度な平滑化(over-smoothing)問題を回避できる。さらに、注意メカニズムにより、ジェスチャーの空間的文脈表現が向上している。本アーキテクチャは複数のデータセット上で評価され、優れた性能を示した。

空間注意機構を備えた3Dグラフ畳み込みニューラルネットワークを用いた手話認識 | 最新論文 | HyperAI超神経