Odyssey 2024 - Speech Emotion Recognition Challenge: Datensatz, Baseline-Framework und Ergebnisse
Der Odyssey 2024 Speech Emotion Recognition (SER) Challenge zielt darauf ab, die Innovation im Erkennen von Emotionen aus spontanem Sprachmaterial zu fördern und über herkömmliche Datensätze hinauszugehen, die auf aufgesetzten Szenarien basieren. Er bietet trainings-, validierungs- und eine exklusive Testmenge, die jeweils für die beiden in dieser Herausforderung verfolgten Tracks – kategorische SER-Aufgaben und Attribut-basierte SER-Aufgaben – annotiert sind. Diese Initiative fördert die Zusammenarbeit zwischen Forschern, um SER-Technologien zu entwickeln, die auch in realen Anwendungsszenarien präzise funktionieren, und ermutigt die Forschergemeinschaft, innovative Ansätze zu erkunden, die auf den neuesten Fortschritten im Bereich der Audiodatenverarbeitung für SER aufbauen. In diesem Paper geben wir eine detaillierte Beschreibung der Baseline, des Leaderboards, der Ergebnisbewertung sowie eine Diskussion der zentralen Erkenntnisse. Die Wettbewerbs-Website mit dem Leaderboard, Links zum Baseline-Code und Anleitungen ist hier zu finden: https://lab-msp.com/MSP-Podcast_Competition/leaderboard.php