HyperAIHyperAI
vor 17 Tagen

LSA-T: Der erste kontinuierliche Datensatz der Argentinischen Gebärdensprache für die Gebärdensprachübersetzung

Pedro Dal Bianco, Gastón Ríos, Franco Ronchetti, Facundo Quiroga, Oscar Stanchi, Waldo Hasperué, Alejandro Rosete
LSA-T: Der erste kontinuierliche Datensatz der Argentinischen Gebärdensprache für die Gebärdensprachübersetzung
Abstract

Die Übersetzung von Gebärdensprache (SLT) ist ein aktives Forschungsfeld, das Mensch-Computer-Interaktion, Computer Vision, Naturalsprachverarbeitung und maschinelles Lernen umfasst. Fortschritte auf diesem Gebiet könnten zu einer höheren Integration gehörloser Menschen führen. In dieser Arbeit präsentieren wir, soweit uns bekannt ist, zum ersten Mal einen kontinuierlichen Datensatz der argentinischen Gebärdensprache (LSA). Der Datensatz enthält 14.880 videobasierte Sätze der LSA, die aus dem YouTube-Kanal CN Sordos extrahiert wurden, sowie jeweils Labels und Schlüsselpunkt-Anmerkungen für jeden Sprecher. Außerdem stellen wir eine Methode zur Identifizierung des aktiven Sprechers vor, eine detaillierte Analyse der Datensatzmerkmale, ein Visualisierungstool zur Exploration des Datensatzes sowie ein neuronales SLT-Modell zur Nutzung als Basis für zukünftige Experimente.