HyperAIHyperAI
il y a 17 jours

Chronomètres et autres : Une évaluation pratique pour la compréhension du langage parlé avec des nombres

Loren Lugosch, Piyush Papreja, Mirco Ravanelli, Abdelwahab Heba, Titouan Parcollet
Chronomètres et autres : Une évaluation pratique pour la compréhension du langage parlé avec des nombres
Résumé

Cet article présente Timers and Such, un nouveau jeu de données open source composé de commandes orales en anglais pour des cas d’utilisation courants du contrôle vocal impliquant des nombres. Nous décrivons l’écart présent dans les jeux de données existants en matière de compréhension du langage parlé, que Timers and Such comble, ainsi que la conception et la création de ce jeu de données. Nous présentons également des expérimentations menées avec plusieurs modèles de base basés sur la reconnaissance automatique de la parole (ASR) et des modèles end-to-end, dont le code a été rendu disponible dans le cadre de la bibliothèque SpeechBrain.

Chronomètres et autres : Une évaluation pratique pour la compréhension du langage parlé avec des nombres | Articles de recherche récents | HyperAI