17일 전

CAGE: 순환형 정서 지도 표현 추론

Niklas Wagner, Felix Mätzler, Samed R. Vossberg, Helen Schneider, Svetlana Pavlitska, J. Marius Zöllner
CAGE: 순환형 정서 지도 표현 추론
초록

감정과 표정을 이해하는 것은 사용자 경험 향상과 관련된 여러 분야에서 관심을 끌고 있는 과제이다. 일반적인 인식과는 달리, 감정은 이산적인 실체가 아니라 연속적인 스케일을 따라 존재한다는 것이 입증되었다. 문화적 배경, 개인적 경험, 인지적 편향 등 다양한 요인으로 인해 사람들은 이산적 감정을 각각 다르게 이해한다. 따라서 감정 표현 이해에 있어 이산적인 카테고리에 의존하는 대부분의 접근 방식은 본질적으로 편향을 내포하고 있다. 본 논문에서는 감정의 원형 모델(circumplex model of affect)의 구성 요소를 포함한 두 가지 대표적인 데이터셋(AffectNet 및 EMOTIC)에 대한 비교적 심층적인 분석을 제시한다. 또한 경량화된 응용 프로그램에 적합한 얼굴 표정 예측 모델을 제안한다. 소규모 MaxViT 기반의 모델 아키텍처를 활용하여, 훈련 시 이산적 표정 카테고리 레이블뿐 아니라 연속적인 평가(Valence)와 각성(Arousal) 레이블을 고려했을 때의 영향을 평가한다. 본 연구에서는 이산적 카테고리 레이블 외에 평가와 각성 요소를 함께 고려함으로써 표정 추론 성능이 크게 향상됨을 보여준다. 제안된 모델은 AffectNet 데이터셋에서 기존 최고 성능 모델들을 상회하며, 평가 및 각성 추론 측면에서 RMSE가 7% 낮은 최고의 성능을 기록하였다. 실험 재현을 위한 훈련 스크립트 및 학습된 가중치는 다음 링크에서 확인할 수 있다: https://github.com/wagner-niklas/CAGE_expression_inference.