17일 전

시각 트랜스포머를 이용한 압축 및 권장 기법을 통한 얼굴 표정 인식

Mouath Aouayeb, Wassim Hamidouche, Catherine Soladie, Kidiyo Kpalma, Renaud Seguier
시각 트랜스포머를 이용한 압축 및 권장 기법을 통한 얼굴 표정 인식
초록

지난 수십 년 동안 다양한 얼굴 표정 데이터베이스가 공개되면서, 얼굴 표정 인식(Facial Expression Recognition, FER) 작업은 큰 관심을 받게 되었다. 공개된 데이터베이스의 다수의 출처는 얼굴 인식 작업에 여러 도전 과제를 야기하였다. 이러한 도전 과제는 일반적으로 합성곱 신경망(Convolutional Neural Network, CNN) 아키텍처를 통해 해결되어 왔다. CNN 모델과 달리, 최근에는 주의 메커니즘(attention mechanism)을 기반으로 한 트랜스포머(Transformer) 모델이 시각 작업 해결을 위해 제안되고 있다. 그러나 트랜스포머 모델의 주요 과제 중 하나는 훈련을 위해 대량의 데이터가 필요하다는 점이며, 이는 다른 시각 응용 분야에 비해 대부분의 FER 데이터베이스가 제한적이라는 점과 대비된다. 따라서 본 논문에서는 FER 작업을 위해 시각 트랜스포머를 스퀴즈 앤 엑사이테이션(Squeeze and Excitation, SE) 블록과 함께 학습하는 방법을 제안한다. 제안된 방법은 CK+, JAFFE, RAF-DB, SFEW 등 공개된 다양한 FER 데이터베이스에서 평가되었다. 실험 결과, 제안 모델은 CK+ 및 SFEW에서 최신 기술(SOTA)을 초월하며, JAFFE 및 RAF-DB에서는 경쟁력 있는 성능을 달성하였다.

시각 트랜스포머를 이용한 압축 및 권장 기법을 통한 얼굴 표정 인식 | 최신 연구 논문 | HyperAI초신경