Reconnaissance émotionnelle vocale
La reconnaissance des émotions dans la parole est une tâche en traitement de la parole et en paralinguistique computationnelle qui vise à identifier et classifier les états émotionnels exprimés par les locuteurs grâce à l'analyse de modèles de parole tels que la prosodie, le ton et le rythme, y compris la joie, la colère, la tristesse ou la frustration. Cette technologie a une valeur d'application significative dans des domaines tels que l'interaction homme-machine, l'évaluation de la santé mentale et le service client. Pour la reconnaissance d'émotions multimodale, veuillez télécharger les résultats sur la page désignée.
CREMA-D
SepTr
IEMOCAP
SER with MTL
RAVDESS
xlsr-Wav2Vec2.0(FineTuning)
MSP-Podcast (Valence)
MSP-Podcast (Activation)
wav2small-Teacher
MSP-Podcast (Dominance)
w2v2-L-robust-12
RESD
emotion2vec+base
Dusha Crowd
Dusha Podcast
Dusha baseline
EMODB
VGG-optiVMD
EmoDB Dataset
VQ-MAE-S-12 (Frame) + Query2Emo
LSSED
PyResNet
MSP-IMPROV
emoDARTS
Quechua-SER
LSTM
ShEMO