18일 전

이중 방향 주의 메시드 특징 네트워크를 이용한 얼굴 표정 인식

{Zhigang Song, YuFei Wang, Ye Zhang, Yuhang Zhang, Saining Zhang}
초록

최근 몇 년간 얼굴 표정 인식(Facial Expression Recognition, FER)은 컴퓨터 비전 분야에서 큰 주목을 받고 있다. 본 논문은 FER에 특화된 혁신적인 네트워크인 이중 방향 주의 메이드 특징 네트워크(Dual-Direction Attention Mixed Feature Network, DDAMFN)를 제안한다. 이 네트워크는 강건성과 경량화라는 두 가지 특성을 동시에 갖추고 있다. 네트워크 아키텍처는 두 가지 주요 구성 요소로 이루어져 있다. 하나는 백본(backbone)으로 기능하는 혼합 특징 네트워크(Mixed Feature Network, MFN), 다른 하나는 헤드(head)로 작용하는 이중 방향 주의 네트워크(Dual-Direction Attention Network, DDAN)이다. MFN의 성능을 향상시키기 위해 다양한 크기의 커널을 활용하여 강건한 특징을 추출한다. 또한, 입력 데이터의 두 가지 방향으로 주의 맵(attention map)을 생성하는 새로운 이중 방향 주의(Dual-Direction Attention, DDA) 헤드를 제안함으로써 모델이 장거리 의존성(long-range dependencies)을 효과적으로 포착할 수 있도록 했다. 정확도 향상을 위해 DDAN에 대해 서로 다른 영역에 집중하는 다양한 헤드를 갖춘 새로운 주의 손실(attention loss) 메커니즘도 도입하였다. AffectNet, RAF-DB, FERPlus 등 여러 널리 사용되는 공개 데이터셋에서 수행된 실험 평가를 통해 기존 모델들과 비교하여 DDAMFN의 우수성을 입증하였으며, 이는 FER 분야에서 최신 기술(SOTA, State-of-the-Art) 수준의 모델임을 시사한다.