17일 전

FP-Age: 자연 환경에서의 얼굴 연령 추정을 위한 얼굴 파싱 주의력 활용

Yiming Lin, Jie Shen, Yujiang Wang, Maja Pantic
FP-Age: 자연 환경에서의 얼굴 연령 추정을 위한 얼굴 파싱 주의력 활용
초록

이미지 기반 연령 추정은 얼굴 이미지로부터 사람의 연령을 예측하는 것을 목표로 하며, 다양한 실세계 응용 분야에서 활용되고 있다. 기존의 엔드투엔드 딥 모델은 벤치마크 데이터셋에서 연령 추정 문제에 있어 놀라운 성과를 달성했지만, 머리 자세, 얼굴 표정, 가림 현상 등의 큰 변동성으로 인해 실제 환경(인-더-월드, in-the-wild)에서의 성능은 여전히 개선할 여지가 크다. 이러한 문제를 해결하기 위해, 우리는 얼굴의 의미 정보( facial semantics)를 연령 추정에 명시적으로 통합할 수 있는 간단하면서도 효과적인 방법을 제안한다. 이를 통해 모델은 머리 자세나 비정형 변형에 관계없이, 정렬되지 않은 얼굴 이미지에서 가장 정보량이 큰 얼굴 부분에 정확히 집중할 수 있도록 학습하게 된다. 이를 위해 우리는 다양한 스케일에서 의미 정보를 학습할 수 있도록 설계된 얼굴 파싱 기반 네트워크와, 이러한 의미 특징을 연령 추정에 활용하기 위한 새로운 얼굴 파싱 주의 모듈(attention module)을 제안한다. 실제 환경 데이터에서 제안한 방법의 성능을 평가하기 위해, 새로운 도전적인 대규모 벤치마크인 IMDB-Clean을 소개한다. 이 데이터셋은 제약 조건을 가진 클러스터링 방법을 사용해 노이즈가 많은 IMDB-WIKI 데이터셋을 반자동으로 정제하여 생성되었다. IMDB-Clean 및 기타 벤치마크 데이터셋에서 수행된 종합적인 실험을 통해, 데이터셋 내부 및 데이터셋 간 평가 프로토콜 모두에서 기존의 모든 연령 추정 방법을 일관되게 상회하며, 새로운 최고 성능(새로운 최상위 수준의 성능, state-of-the-art)을 달성함을 보였다. 현재까지 알려진 바에 따르면, 본 연구는 얼굴 파싱 주의 기법을 활용하여 의미 인식형 연령 추정을 실현한 최초의 시도로, 다른 고수준 얼굴 분석 작업에 대한 영감을 줄 수 있을 것으로 기대된다. 코드와 데이터는 \url{https://github.com/ibug-group/fpage}에서 제공된다.