9日前
フレーム順序制約なしの手話認識:アルゼンチン手話における概念実証
{Alejandro Rosete, Laura Lanzarini, César Estrebou, Facundo Quiroga, Franco Ronchetti}
要約
自動手話認識(SLR)は、人間-コンピュータインタラクションおよび機械学習の分野において重要な研究課題である。一方で、動画処理、画像処理、知能システム、言語学など多様な知識分野の統合を要する複雑な課題を提示している。他方で、堅牢な手話認識技術の開発は、聴覚障害者の言語翻訳支援や社会参加の促進、および聴覚健全者に対する手話教育の支援に寄与する可能性を有している。従来のSLRシステムは、主に隠れマルコフモデル(HMM)、動的時間歪み(DTW)、あるいは類似のモデルを用いて、手話の符号を認識する。これらの手法は、フレームの順序性を活用することで、認識の仮説空間を効果的に削減する。本論文では、位置、動き、手の形といった異なる特徴タイプに基づく部分的分類器を統合する一般的な確率モデルを提案する。このモデルは、すべての分類ステップにおいて「語の袋(bag-of-words)」アプローチを採用し、認識において順序情報が必ずしも必要ではないという仮説を検証する。実験結果として、アルゼンチン手話(ASL)データセット(64種類の手話符号、3200サンプル)を用いた評価において、97%の認識精度を達成した。この結果は、順序情報に依存せずに手話認識が可能であることを示す有力な証拠を提供している。