Odyssey 2024 - Défi de reconnaissance des émotions par la parole : jeu de données, cadre de référence et résultats
Le Défi de reconnaissance des émotions dans la parole (SER) Odyssey 2024 vise à stimuler l'innovation dans la reconnaissance des émotions à partir de discours spontanés, en s'éloignant des jeux de données traditionnels issus de scénarios interprétés. Il propose des ensembles d'entraînement, de développement et un ensemble de test exclusif, tous annotés pour les deux catégories explorées dans ce défi : les tâches SER catégorielles et les tâches SER par attributs. Cette initiative encourage la collaboration entre chercheurs afin de développer des technologies de SER performantes dans des environnements réels, tout en incitant les équipes à explorer des approches innovantes tirant parti des dernières avancées en traitement audio pour la SER. Dans cet article, nous présentons une description détaillée de la solution de base, du classement (leaderboard), de l'évaluation des résultats, ainsi qu'une discussion des principaux résultats obtenus. Le site web du concours, comprenant le classement, les liens vers le code de la solution de base et les instructions, est accessible à l'adresse suivante : https://lab-msp.com/MSP-Podcast_Competition/leaderboard.php