HyperAIHyperAI
il y a 11 jours

SLURP : Un package de ressources pour la compréhension des langues parlées

Emanuele Bastianelli, Andrea Vanzo, Pawel Swietojanski, Verena Rieser
SLURP : Un package de ressources pour la compréhension des langues parlées
Résumé

La compréhension du langage parlé (SLU) permet d’inférer directement le sens sémantique à partir de données audio, offrant ainsi la perspective de réduire la propagation des erreurs et les malentendus dans les applications destinées aux utilisateurs finaux. Toutefois, les ressources publiques disponibles pour la SLU restent limitées. Dans cet article, nous présentons SLURP, un nouveau package SLU comprenant les éléments suivants : (1) un nouveau jeu de données exigeant en anglais couvrant 18 domaines, significativement plus vaste et linguistiquement plus diversifié que les jeux de données existants ; (2) des modèles de référence performants fondés sur des systèmes de pointe en NLU (Natural Language Understanding) et ASR (Automatic Speech Recognition) ; (3) une nouvelle métrique transparente pour l’étiquetage des entités, permettant une analyse détaillée des erreurs afin d’identifier les axes d’amélioration potentiels. SLURP est disponible à l’adresse suivante : https://github.com/pswietojanski/slurp.

SLURP : Un package de ressources pour la compréhension des langues parlées | Articles de recherche récents | HyperAI