HyperAIHyperAI
vor 2 Monaten

Sprachbefehle: Ein Datensatz für die Erkennung von Sprache mit eingeschränktem Vokabular

Pete Warden
Sprachbefehle: Ein Datensatz für die Erkennung von Sprache mit eingeschränktem Vokabular
Abstract

Beschreibt einen Audio-Datensatz von gesprochenen Wörtern, der entwickelt wurde, um die Ausbildung und Bewertung von Stichworterkennungssystemen zu unterstützen. Es wird erläutert, warum diese Aufgabe eine interessante Herausforderung darstellt und warum sie ein spezialisiertes Datensatz benötigt, das sich von den konventionellen Datensätzen unterscheidet, die für die automatische Spracherkennung ganzer Sätze verwendet werden. Ein Methodikvorschlag zur reproduzierbaren und vergleichbaren Genauigkeitsmetriken für diese Aufgabe wird präsentiert. Es wird detailliert beschrieben, wie die Daten erhoben und verifiziert wurden, was der Datensatz enthält, welche früheren Versionen existieren und welche Eigenschaften er aufweist. Der Bericht schließt mit der Vorstellung von Baseline-Ergebnissen von Modellen, die auf diesem Datensatz trainiert wurden.