8日前

小標本手法の手形認識における比較

{Laura Lanzarini, Waldo Hasperué, Pedro Dal Bianco, Gastón Gustavo Ríos, Ulises Jeremias Cornejo Fandos, Franco Ronchetti, Facundo Quiroga}
要約

自動手話翻訳(SLT)システムは、聴覚障害者コミュニティ内外におけるコミュニケーションを向上させる上で極めて有効なツールとなる可能性を秘めています。現状、効果的な翻訳モデルの実現を阻んでいる主な課題は、ラベル付きデータの低 Availability にあります。この点が、現代の深層学習モデルの活用を妨げています。SLTは、多数のサブタスクを含む複雑な問題であり、その中でも手形認識(handshape recognition)が最も重要なタスクです。本研究では、小規模データセット向けに最適化された複数のモデルを比較し、手形認識タスクにおける性能向上を検証しました。特に、Wide-DenseNet と少サンプル学習向けのプロトタイプネットワーク(Prototypical Network)を、転移学習(transfer learning)の有無にかかわらず評価するとともに、モデルに依存しないメタ学習(Model-Agnostic Meta-Learning: MAML)の適用も検討しました。その結果、転移学習を用いない Wide-DenseNet および転移学習を用いた Prototypical Network が最も優れた性能を示しました。特に、サンプル数が30未満の場合、Prototypical Network は著しく優れた性能を発揮することが明らかになりました。一方、サンプル数が多い場合には Wide-DenseNet が最良の結果を達成しました。一方で、MAML はいかなる設定においても性能向上をもたらさなかったことが判明しました。これらの結果は、より効果的な SLT モデルの設計に資する重要な知見を提供します。

小標本手法の手形認識における比較 | 最新論文 | HyperAI超神経