알츠하이머병을 가진 노인의 정서 반응을 탐지하기 위한 응용을 위한 얼굴 정서 인식을 위한 새로운 딥러닝 접근법
얼굴 표정은 다양한 감정을 전달하는 핵심적인 비언어적 소통 방식이다. 최근 인공지능과 컴퓨터 비전 분야의 발전으로 인해, 특히 컨볼루션 신경망(Convolutional Neural Networks)을 활용한 딥러닝 기법이 얼굴 감정 인식(Facial Emotion Recognition, FER) 분야에서 매우 효과적으로 활용되고 있다. 본 논문에서는 수정된 ConvNeXt 아키텍처를 기반으로 하며, 몇 가지 핵심 기술적 혁신을 도입한 고도화된 딥러닝 프레임워크인 EmoNeXt을 제안한다. EmoNeXt는 공간 변환 네트워크(Spatial Transformer Networks)를 통합하여 얼굴의 가장 표현력 있는 영역에 주목할 수 있도록 하며, 스queeze-and-excitation 블록을 도입하여 채널 간의 의존성을 강화한다. 또한 자기 주의(self-attention) 정규화 항을 포함하여, 더 컴팩트하고 구분력 있는 특징 벡터 학습을 유도한다. 초기 평가에서는 FER2013 데이터셋을 기반으로 수행되었으며, 현재는 더 넓은 실세계 및 포즈된 상황에서의 일반화 능력을 입증하기 위해 AffectNet과 CK+라는 두 가지 널리 사용되는 벤치마크 데이터셋에서도 추가 검증이 이루어졌다. 또한 각 기술적 개선 항목의 기여도를 분석하고 정량화하기 위해 광범위한 아블레이션(Ablation) 연구를 수행하였으며, 이는 각 구성 요소가 모델 성능 향상에 긍정적인 영향을 미친다는 것을 확인시켜 주었다. 마지막으로, 본 논문은 EmoNeXt가 알츠하이머 환자와 같은 고령 환자군의 감정 인식에 어떻게 활용될 수 있는지 탐색하며, 신경퇴행성 질환 환자의 치료 품질 향상을 위해 정확한 감정 인식 기술의 필요성을 강조한다. 본 연구 결과는 EmoNeXt가 신경퇴행성 질환을 가진 환자들을 포함한 의료 환경에서 감정 소통을 개선하는 데 유용한 도구로서의 잠재력을 입증한다.