Speech Emotion Recognition
情感语音识别是语音处理和计算副语言学的一项任务,旨在通过分析语音模式如韵律、音高和节奏来识别和分类说话人所表达的情感状态,包括快乐、愤怒、悲伤或挫败等。该技术在人机交互、心理健康评估和客户服务等领域具有重要应用价值。对于多模态情感识别,请上传结果至指定页面。
CREMA-D
Vertically long patch ViT
Dusha Crowd
Dusha Podcast
Dusha baseline
EMODB
VGG-optiVMD
EmoDB Dataset
VQ-MAE-S-12 (Frame) + Query2Emo
IEMOCAP
SER with MTL
LSSED
PyResNet
MSP-IMPROV
emoDARTS
MSP-Podcast (Activation)
wav2small-Teacher
MSP-Podcast (Dominance)
wav2small-Teacher
MSP-Podcast (Valence)
Quechua-SER
LSTM
RAVDESS
xlsr-Wav2Vec2.0(FineTuning)
RESD
emotion2vec+base
ShEMO