
초록
다양한 연령 추정 방법을 비교하는 것은 벤치마킹 과정의 일관성 부족으로 인해 공개된 결과의 신뢰성에 문제가 있어 도전 과제가 된다. 과거 연구들은 전문적인 방법을 활용해 지난 10년간 지속적인 성능 향상이 있었다고 보고해 왔으나, 본 연구의 결과는 이러한 주장에 도전한다. 본 논문은 현재 사용 중인 평가 프로토콜에서 발생하는 두 가지 단순하지만 지속적인 문제점을 식별하고, 이를 해결하는 방법을 제시한다. 우리는 최신의 얼굴 연령 추정 방법들을 대상으로 광범위한 비교 분석을 수행한다. 놀랍게도, 얼굴 정렬, 얼굴 커버리지, 이미지 해상도, 모델 아키텍처, 사전 훈련에 사용된 데이터 양과 같은 다른 요인들에 비해, 다양한 방법 간의 성능 차이는 거의 무시할 수 있을 정도로 작음을 발견한다. 이러한 통찰을 바탕으로 FaRL을 백본 모델로 사용할 것을 제안하며, 공개 데이터셋 전반에서 그 효과성을 입증한다. 본 연구의 소스 코드와 정확한 데이터 분할 정보는 GitHub에 공개한다.