18일 전
자연 환경에서의 얼굴 표정 인식을 위한 깊이 있는 글로벌 다중 스케일 및 로컬 주의 특징 학습
{Shanmin Wang, Qingshan Liu, Zengqun Zhao}
초록
자연 상태에서의 얼굴 표정 인식(Facial Expression Recognition, FER)은 가림 현상과 자세 변형이 두 가지 주요 과제로 널리 주목받고 있다. 본 논문에서는 자연 상태의 FER를 위한 전역 다중 스케일 및 국소 주의망(MA-Net)을 제안한다. 구체적으로 제안된 네트워크는 특징 사전 추출기, 다중 스케일 모듈, 국소 주의 모듈의 세 가지 주요 구성 요소로 구성된다. 특징 사전 추출기는 중간 수준의 특징을 사전 추출하는 데 사용되며, 다중 스케일 모듈은 다양한 수용 필드를 가진 특징을 융합함으로써 깊은 합성곱층이 가림 현상과 자세 변화에 취약해지는 것을 완화한다. 또한 국소 주의 모듈은 네트워크가 국소적으로 두드러진 특징에 주목하도록 유도하여, 자연 상태의 FER에서 가림 현상과 비전면 자세 문제로 인한 간섭을 완화한다. 광범위한 실험을 통해 제안된 MA-Net이 CAER-S, AffectNet-7, AffectNet-8, RAFDB, SFEW 등의 자연 상태 FER 벤치마크에서 최신 기술 수준의 성능을 달성함을 입증하였으며, 각각 88.42%, 64.53%, 60.29%, 88.40%, 59.40%의 정확도를 기록하였다.