18일 전

라벨 분포 학습을 통한 강건한 경량 얼굴 표정 인식 네트워크

{Feng Zhou, Qingshan Liu, Zengqun Zhao}
초록

이 논문은 와일드 환경에서의 얼굴 표정 인식(Facial Expression Recognition, FER)에 대해 매우 뛰어난 로버스트성과 효율성을 갖춘 신경망인 EfficientFace를 제안한다. 이 네트워크는 파라미터 수가 매우 적지만, 와일드 환경에서의 FER에 대해 뛰어난 안정성을 보인다. 먼저, 경량화된 네트워크의 로버스트성을 향상시키기 위해 국소적 특징 추출기와 채널-공간 조절기(Channels-Spatial Modulator)를 설계하였으며, 이 과정에서 깊이 분리형 컨볼루션(depthwise convolution)을 활용하였다. 이를 통해 네트워크는 국소적 특징과 전역적으로 중요한 얼굴 특징을 동시에 인식할 수 있게 되었다. 또한, 대부분의 감정이 기본 감정들의 조합, 혼합 또는 복합 형태로 나타난다는 점을 고려하여, 간단하면서도 효율적인 레이블 분포 학습(Label Distribution Learning, LDL) 방법을 제안하고, 새로운 학습 전략으로 도입하였다. 실제의 가림 및 자세 변화가 있는 데이터셋에서 수행된 실험 결과, 제안하는 EfficientFace가 가림 및 자세 변화 조건에서도 뛰어난 로버스트성을 보임을 확인하였다. 더불어, RAF-DB, CAER-S, AffectNet-7 데이터셋에서 각각 88.36%, 85.87%, 63.70%의 정확도로 최신 기술 수준(SOTA) 성능을 달성하였으며, AffectNet-8 데이터셋에서도 59.89%의 정확도로 비교 가능한 성능을 기록하였다.