18일 전

공간 편향과 코사인 조화 손실을 활용한 얼굴 표정 인식을 향상시키는 경량 모델

{Liangyu Huang, Xuefeng Chen}
초록

이 논문은 공간 편향(Spatial Bias, SB)을 갖춘 경량화된 얼굴 표정 인식 네트워크인 Lightweight Facial Network with Spatial Bias(LFNSB)를 제안한다. LFNSB 모델은 모델 복잡성과 인식 정확도 사이의 균형을 잘 맞추고 있다. 이 모델은 두 가지 핵심 구성 요소로 이루어져 있다: 경량 특징 추출 네트워크(Lightweight Feature Network, LFN)와 전역 정보를 통합하는 공간 편향(Spatial Bias, SB) 모듈이다. LFN은 채널 결합 연산과 딥웨이즈 컨볼루션(Deepwise Convolution) 기법을 도입하여 파라미터 수를 효과적으로 줄이면서도 특징 표현 능력을 향상시킨다. 또한, 공간 편향 모듈은 얼굴의 국소적 특징에 주목할 수 있도록 하면서도 얼굴의 다양한 영역 간의 종속성을 동시에 포착할 수 있게 한다. 더불어, 고차원 공간 내 특징 벡터 간의 상대적 위치를 최적화하는 새로운 손실 함수인 코사인-하모니 손실(Cosine-Harmony Loss)을 설계하였다. 이 손실 함수는 특징 간의 분리도와 클러스터링 성능을 향상시켜 더 나은 특징 표현을 가능하게 한다. AffectNet 및 RAF-DB 데이터셋에서 수행된 실험 결과에 따르면, 제안된 LFNSB 모델은 얼굴 표정 인식 작업에서 뛰어난 성능을 보였다. 높은 인식 정확도를 달성하면서도 파라미터 수를 크게 감소시켜 모델의 복잡성을 크게 낮추는 데 성공하였다.