대규모 야외 얼굴 인식을 위한 동적 클래스 대기열

실제 응용에 있어 자연 환경에서의 대규모 얼굴 데이터셋을 활용한 구분 가능한 표현 학습은 매우 중요하지만, 여전히 도전 과제가 남아 있다. 이러한 어려움은 여러 측면에서 발생하며, 본 연구는 계산 자원 제약과 긴 꼬리(class distribution) 형태의 클래스 분포 문제에 초점을 맞춘다. 최근, 깊은 신경망과 잘 설계된 손실 함수를 기반으로 한 분류 기반 표현 학습이 우수한 인식 성능을 보여주고 있다. 그러나 계산 및 메모리 비용은 학습 데이터셋 내 개체 수(클래스 수)에 비례하여 선형적으로 증가하며, 학습 과정은 불균형한 클래스 분포로 인해 어려움을 겪는다. 본 연구에서는 이러한 두 가지 문제를 해결하기 위해 동적 클래스 큐(Dynamic Class Queue, DCQ)를 제안한다. 구체적으로, 학습 중 각 반복(iteration)마다 인식을 위한 클래스의 하위 집합을 동적으로 선택하고, 해당 클래스의 가중치를 실시간으로 생성하여 큐에 저장한다. 각 반복에서 전체 클래스 중 일부만 선택되므로 계산 요구량이 감소한다. 단일 서버 환경에서 모델 병렬 처리 없이도 대규모 데이터셋에서 실험적으로 10%의 클래스만 사용해도 모든 클래스를 사용할 때와 유사한 성능을 달성함을 입증하였다. 또한 클래스 가중치는 소수의 예시(한정된 샘플)를 기반으로 동적으로 생성되므로, 샘플 수가 적은 꼬리 클래스에 특히 적합하다. 제안한 방법은 67만 개의 개체를 포함하고 있으며, 그 중 88% 이상이 10개 이하의 샘플을 가진 최대 규모의 공개 데이터셋인 Megaface Challenge2(MF2)에서 강력한 기준 모델 대비 명확한 성능 향상을 보였다. 코드는 https://github.com/bilylee/DCQ 에서 공개되어 있다.