HyperAIHyperAI
vor 8 Tagen

Ein Vergleich kleiner Stichprobenverfahren für die Handformerkennung

{Laura Lanzarini, Waldo Hasperué, Pedro Dal Bianco, Gastón Gustavo Ríos, Ulises Jeremias Cornejo Fandos, Franco Ronchetti, Facundo Quiroga}
Abstract

Automatische Übersetzungs-Systeme für Gebärdensprache (SLT) können ein wertvoller Beitrag zur Verbesserung der Kommunikation innerhalb und mit gehörlosen Gemeinschaften sein. Derzeit liegt das Hauptproblem für effektive Übersetzungsmodelle in der geringen Verfügbarkeit annotierter Daten, was die Anwendung moderner Deep-Learning-Modelle erschwert.SLT ist ein komplexes Problem, das zahlreiche Teilaufgaben umfasst, wobei die Erkennung der Handform die wichtigste ist. Wir vergleichen eine Reihe von Modellen, die speziell für kleine Datensätze optimiert wurden, um deren Leistung bei der Erkennung von Handformen zu verbessern. Dabei evaluieren wir Wide-DenseNet-Modelle sowie Few-Shot-Prototypische Netzwerke mit und ohne Transfer-Learning sowie mit Model-Agnostic Meta-Learning (MAML).Unsere Ergebnisse zeigen, dass Wide-DenseNet ohne Transfer-Learning sowie prototypische Netzwerke mit Transfer-Learning die besten Ergebnisse erzielen. Insbesondere erweisen sich prototypische Netzwerke bei weniger als 30 Trainingsbeispielen als deutlich überlegen, während Wide-DenseNet bei größeren Datensätzen die besten Leistungen erreicht. Im Gegensatz dazu verbessert MAML in keiner der betrachteten Szenarien die Leistung. Diese Erkenntnisse können zur Gestaltung effizienterer SLT-Modelle beitragen.

Ein Vergleich kleiner Stichprobenverfahren für die Handformerkennung | Neueste Forschungsarbeiten | HyperAI