
초록
얼굴 표현은 인간의 의사소통에서 중요한 역할을 하며, 다양한 감정을 강력하고 효과적으로 전달하는 수단으로 작용합니다. 인공지능과 컴퓨터 비전 기술의 발전에 따라, 딥 뉴럴 네트워크는 얼굴 감정 인식을 위한 효과적인 도구로 부상하였습니다. 본 논문에서는 적응형 ConvNeXt 아키텍처를 기반으로 한 새로운 딥 러닝 프레임워크인 EmoNeXt를 제안합니다. 우리는 공간 변환기 네트워크(Spatial Transformer Network, STN)를 통합하여 얼굴의 특징이 풍부한 영역에 집중하고, 채널 간 의존성을 포착하기 위해 Squeeze-and-Excitation 블록을 사용합니다. 또한, 모델이 컴팩트한 특성 벡터를 생성하도록 유도하는 자기 주의 정규화 항(self-attention regularization term)을 도입하였습니다. FER2013 데이터셋에서 감정 분류 정확도 측면에서 기존 최신 딥 러닝 모델들보다 우수함을 입증하였습니다.