18일 전

세그멘테이션 VGG-19 아키텍처를 이용한 새로운 얼굴 감정 인식 모델

{Rajeswari Sridhar, M. Sridevi, M. Savithadevi, S. Vignesh}
초록

얼굴 감정 인식(Facial Emotion Recognition, FER)은 생체 인식, 정신 질환 탐지, 인간 행동 이해, 심리적 프로파일링 등 다양한 응용 분야에서 주목받으며 최근 몇 년간 인기를 끌고 있다. 그러나 감정 간 일반화를 이루는 데는 여러 요인이 복합적으로 작용하여 정확하고 강건한 FER 파이프라인 개발이 여전히 도전 과제로 남아 있다. 감정 인식 성능을 저해하는 주요 요인으로는 자세 변화, 얼굴 구조의 이질성, 조명 조건의 변화, 부분적 가림, 낮은 해상도, 노화 등이 있다. 이러한 문제를 극복하기 위해 히스토그램 방향 기울기(Histogram of Oriented Gradients, HOG)와 국소 이진 패턴(Local Binary Pattern, LBP) 히스토그램 등의 다양한 기법이 개발되었으나, 이러한 방법들은 수동적인 특징 선택을 필요로 한다. 반면, 합성곱 신경망(Convolutional Neural Networks, CNN)은 이러한 수동적 특징 선택 문제를 해결함과 동시에, 기존 FER 모델과 비교해 독특한 특징 추출 전략을 통해 FER 작업에서 높은 잠재력을 보여주고 있다. 본 논문에서는 비주얼 기하 그룹(Visual Geometry Group, VGG) 계층 사이에 U-Net 기반의 세그멘테이션 계층을 통합함으로써 특징 맵으로부터 더욱 중요한 특징을 강조할 수 있도록 하는 새로운 CNN 아키텍처를 제안한다. 이 구조는 VGG 계층을 통과하는 중복 정보의 흐름을 효과적으로 조절함으로써 모델의 성능을 향상시킨다. 제안된 모델은 FER-2013 데이터셋에서 기존의 유명한 FER 모델들과 비교하여 최신 기준(SOTA, State-of-the-Art) 수준의 단일 네트워크 정확도를 달성하였다.