vor 17 Tagen
Timer und Ähnliches: Ein praktischer Benchmark für die Sprachverstehens mit Zahlen
Loren Lugosch, Piyush Papreja, Mirco Ravanelli, Abdelwahab Heba, Titouan Parcollet

Abstract
Diese Arbeit stellt Timers and Such vor, einen neuen Open-Source-Datensatz mit gesprochenen englischen Befehlen für gängige Sprachsteuerungsanwendungsfälle, die Zahlen beinhalten. Wir beschreiben die Lücke in bestehenden Datensätzen für gesprochene Sprachverstehensanwendungen, die Timers and Such schließt, sowie die Gestaltung und Erstellung des Datensatzes. Zudem präsentieren wir Experimente mit mehreren ASR-basierten und end-to-end-Benchmark-Modellen, deren Code als Teil des SpeechBrain-Tools integriert und öffentlich zugänglich gemacht wurde.