8日前

手形認識に向けた畳み込みアーキテクチャの研究:日本語手話への応用

{Rosete Alejandro, LanzariniLaura Cristina, Ronchetti Franco, Antonio Ramiro, Quiroga Facundo}
手形認識に向けた畳み込みアーキテクチャの研究:日本語手話への応用
要約

近年、畳み込みニューラルネットワーク(CNN)は多くの分野で性能向上をもたらしているが、手形認識(Handshape Recognition)という分野、特に手話認識(Sign Language Recognition)の文脈におけるCNNの性能は、まだ十分に調査されていない。本研究では、この問題に対するCNNアーキテクチャの適用可能性を検証するため、複数の畳み込み型ネットワークを評価した。LSA16およびRWTH-PHOENIX-Weatherという手形データセットを用いて、LeNet、VGG16、ResNet-34、All Convolutionalアーキテクチャに加え、通常の学習と転移学習(transfer learning)を用いたInceptionモデルを実験し、これらの結果を各データセットにおける最先端技術(state of the art)と比較した。また、ベースラインとしてフィードフォワードニューラルネットワークの実験も行った。さらに、認識性能に与える影響を分析するため、さまざまな前処理手法を検討した。その結果、すべてのモデルが両データセットにおいて比較的高い性能を示した(手動で設計された特徴量手法と同等の性能)。特にVGG16が最も優れた結果を達成し、次いで伝統的なLeNetアーキテクチャがそれに次ぐ結果を示した。また、手の領域を背景から事前にセグメンテーション(前処理)することで、認識精度が著しく向上することが明らかになった。

手形認識に向けた畳み込みアーキテクチャの研究:日本語手話への応用 | 最新論文 | HyperAI超神経