Reconnaissance émotionnelle multimodale

La Reconnaissance Multimodale des Émotions est une tâche visant à identifier avec précision les émotions humaines en intégrant des informations provenant de plusieurs modalités, telles que l'acoustique (A), le texte (T) et la vision (V). L'objectif de cette tâche est d'améliorer la précision et la robustesse de l'analyse émotionnelle pour mieux s'adapter aux scénarios d'application complexes et variés du monde réel. Sur le jeu de données IEMOCAP, tous les modèles doivent utiliser la classification émotionnelle standard à cinq catégories et être évalués selon la méthode leave-one-session-out (LOSO). Cette technologie présente une valeur d'application significative dans des domaines tels que l'interaction homme-machine, le suivi de la santé mentale et le service client intelligent.

IEMOCAP-4

PATHOSnet v2

CMU-MOSEI-Sentiment-3

GraphSmile

Expressive hands and faces dataset (EHF).

SMPLify-X

MELD-Sentiment