2달 전
야생 환경에서 얼굴 이미지를 이용한 연령과 성별 분류를 위한 하이브리드 트랜스포머-시퀀서 접근법
Singh, Aakash ; Singh, Vivek Kumar

초록
컴퓨터 비전과 이미지 처리 기술의 발전은 시각 감시, 타겟 광고, 콘텐츠 기반 검색, 그리고 인간-컴퓨터 상호작용 등의 영역에서 새로운 응용 분야를 만들어냈습니다. 컴퓨터 비전의 다양한 기술 중에서도 특히 얼굴 분석이 많은 주목을 받았습니다. 이전의 여러 연구들은 나이와 성별 분류 등을 포함한 다양한 작업을 위해 얼굴 특징 처리의 다른 응용 분야를 탐구하려고 노력했습니다. 그러나 여태까지 이루어진 여러 연구에도 불구하고, 실제 환경에서 요구되는 정확도 수준에 도달하기 위해서는 야외 조건에서의 인간 얼굴 나이와 성별 분류가 아직 멀었습니다. 따라서 본 논문에서는 이 문제를 해결하기 위해 자기 주의(self-attention)와 양방향 LSTM(BiLSTM) 접근법을 결합한 하이브리드 모델을 제안합니다. 제안된 모델의 성능은 지금까지 제안된 여러 최신 모델들과 비교되었습니다. 제안된 모델은 나이 분류에서 약 10% 그리고 성별 분류에서 약 6% 개선된 결과를 보였습니다. 따라서 제안된 모델은 우수한 성능을 달성하며, 더 일반화된 학습을 제공하는 것으로 나타났습니다. 이 모델은 다양한 이미지 처리 및 컴퓨터 비전 문제에서 핵심 분류 구성 요소로 활용될 수 있습니다.