Command Palette

Search for a command to run...

4달 전

이중 방향 주의 메시드 특징 네트워크를 이용한 얼굴 표정 인식

{Zhigang Song YuFei Wang Ye Zhang Yuhang Zhang Saining Zhang}

초록

최근 몇 년간 얼굴 표정 인식(Facial Expression Recognition, FER)은 컴퓨터 비전 분야에서 큰 주목을 받고 있다. 본 논문은 FER에 특화된 혁신적인 네트워크인 이중 방향 주의 메이드 특징 네트워크(Dual-Direction Attention Mixed Feature Network, DDAMFN)를 제안한다. 이 네트워크는 강건성과 경량화라는 두 가지 특성을 동시에 갖추고 있다. 네트워크 아키텍처는 두 가지 주요 구성 요소로 이루어져 있다. 하나는 백본(backbone)으로 기능하는 혼합 특징 네트워크(Mixed Feature Network, MFN), 다른 하나는 헤드(head)로 작용하는 이중 방향 주의 네트워크(Dual-Direction Attention Network, DDAN)이다. MFN의 성능을 향상시키기 위해 다양한 크기의 커널을 활용하여 강건한 특징을 추출한다. 또한, 입력 데이터의 두 가지 방향으로 주의 맵(attention map)을 생성하는 새로운 이중 방향 주의(Dual-Direction Attention, DDA) 헤드를 제안함으로써 모델이 장거리 의존성(long-range dependencies)을 효과적으로 포착할 수 있도록 했다. 정확도 향상을 위해 DDAN에 대해 서로 다른 영역에 집중하는 다양한 헤드를 갖춘 새로운 주의 손실(attention loss) 메커니즘도 도입하였다. AffectNet, RAF-DB, FERPlus 등 여러 널리 사용되는 공개 데이터셋에서 수행된 실험 평가를 통해 기존 모델들과 비교하여 DDAMFN의 우수성을 입증하였으며, 이는 FER 분야에서 최신 기술(SOTA, State-of-the-Art) 수준의 모델임을 시사한다.

벤치마크

벤치마크방법론지표
facial-expression-recognition-on-affectnetDDAMFN
Accuracy (7 emotion): 67.03
Accuracy (8 emotion): 64.25
facial-expression-recognition-on-affectnetDDAMFN++
Accuracy (7 emotion): 67.36
Accuracy (8 emotion): 65.04
facial-expression-recognition-on-fer-1DDAMFN
Accuracy: 90.74
facial-expression-recognition-on-raf-dbDDAMFN++
Overall Accuracy: 92.34
facial-expression-recognition-on-raf-dbDDAMFN
Overall Accuracy: 91.35

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp