Speech Emotion Recognition
음성에서 감정 인식은 발화자의 감정 상태를 음성 패턴인 억양, 높낮이, 리듬 등을 분석하여 행복, 화남, 슬픔, 좌절 등으로 식별하고 분류하는 음성 처리 및 계산적 파라언어학의 과제입니다. 이 기술은 인간-컴퓨터 상호작용, 정신 건강 평가, 고객 서비스 등의 분야에서 중요한 응용 가치를 가지고 있습니다. 다중 모드 감정 인식 결과는 지정된 페이지에 업로드해 주세요.
CREMA-D
Vertically long patch ViT
Dusha Crowd
Dusha Podcast
Dusha baseline
EMODB
VGG-optiVMD
EmoDB Dataset
VQ-MAE-S-12 (Frame) + Query2Emo
IEMOCAP
SER with MTL
LSSED
PyResNet
MSP-IMPROV
emoDARTS
MSP-Podcast (Activation)
wav2small-Teacher
MSP-Podcast (Dominance)
wav2small-Teacher
MSP-Podcast (Valence)
Quechua-SER
LSTM
RAVDESS
xlsr-Wav2Vec2.0(FineTuning)
RESD
emotion2vec+base
ShEMO