18일 전

야외 환경에서의 얼굴 표정 인식을 위한 딥 어텐션 중심 손실

{Xiaojun Qi, Amir Hossein Farzaneh}
야외 환경에서의 얼굴 표정 인식을 위한 딥 어텐션 중심 손실
초록

실제 환경(와일드)에서 컨볼루션 신경망(CNN)을 활용한 얼굴 표정 인식(Facial Expression Recognition, FER)을 위한 구분 가능한 특징 학습은 클래스 내 변동성의 크기와 클래스 간 유사성으로 인해 비선형적인 과제이다. 최근 많은 FER 방법에서 소프트맥스 손실과 함께 중심 손실(cente r loss) 및 그 변형과 같은 딥 메트릭 학습(Depth Metric Learning, DML) 기법이 임베딩 공간에서 학습된 특징의 구분 능력을 향상시키기 위해 활용되고 있다. 그러나 메트릭 학습 방식으로 모든 특징을 동일하게 감독하는 것은 관련 없는 특징을 포함할 수 있으며, 결과적으로 학습 알고리즘의 일반화 능력을 저하시킬 수 있다. 본 논문에서는 특징 요소 중 의미 있는 부분을 적응적으로 선택하여 구분 능력을 강화하기 위해 딥 어텐션 중심 손실(Deep Attentive Center Loss, DACL)을 제안한다. 제안된 DACL은 CNN의 중간 공간적 특징 맵을 맥락으로 활용하여 특징 중요도와 관련된 어텐션 가중치를 추정하는 어텐션 메커니즘을 통합한다. 추정된 가중치는 중심 손실의 희소 표현 형태를 수용하여 임베딩 공간 내 관련 정보에 대해 클래스 내 밀도 증가와 클래스 간 분리 강화를 선택적으로 실현한다. 두 가지 널리 사용되는 와일드 FER 데이터셋을 대상으로 수행한 광범위한 실험을 통해 제안된 DACL 방법이 최신 기술 대비 우수한 성능을 보임을 입증하였다.