다중모달 감정 인식

다중 모드 감정 인식은 음성(A), 텍스트(T), 시각(V) 등 여러 모드의 정보를 통합하여 인간의 감정을 정확히 식별하는 작업입니다. 이 작업의 목표는 감정 분석의 정밀도와 견고성을 향상시켜 복잡하고 다양한 실제 응용 시나리오에 더 잘 적응하는 것입니다. IEMOCAP 데이터셋에서 모든 모델은 표준 5개 범주 감정 분류를 사용해야 하며, leave-one-session-out(LOSO) 방법으로 평가되어야 합니다. 이 기술은 인간-컴퓨터 상호작용, 정신 건강 모니터링, 지능형 고객 서비스 등의 분야에서 중요한 응용 가치를 가지고 있습니다.