11일 전
매우 대규모 얼굴 인식을 위한 효율적인 훈련 방법
Kai Wang, Shuo Wang, Panpan Zhang, Zhipeng Zhou, Zheng Zhu, Xiaobo Wang, Xiaojiang Peng, Baigui Sun, Hao Li, Yang You

초록
딥러닝 시대에 초대규모且 잘 레이블링된 데이터셋 덕분에 얼굴 인식 기술은 상당한 진전을 이뤘다. 그러나 이러한 거대한 규모의 데이터셋을 활용한 학습은 시간이 오래 걸리며, 하드웨어 자원을 대량으로 소모한다. 따라서 효율적인 학습 방식 설계는 필수적이다. 이 과정에서 주로 발생하는 고비용의 계산 및 메모리 부담은 완전 연결(FC) 계층의 수백만 차원에 이르는 차원 수에서 비롯된다. 이를 해결하기 위해, 성능 저하 없이 시간과 비용을 절감할 수 있는 새로운 학습 방법인 ‘빠른 얼굴 분류(Faster Face Classification, F2C)’를 제안한다. 본 방법은 동적으로 정체성 특징을 저장하고 업데이트하는 동적 클래스 풀(Dynamic Class Pool, DCP)을 도입하여 FC 계층의 대체 수단으로 활용한다. DCP는 전체 얼굴 정체성과 독립된 구조를 가지며, 크기가 작아 계산 및 비용 측면에서 매우 효율적이다. 또한, 다양한 얼굴 인식 벤치마크 및 사내 데이터셋을 대상으로 F2C 방법의 유효성을 검증한 결과, 기존 최고 성능을 기록하는 FC 기반 방법과 비교해 유사한 정확도를 달성하면서도, 인식 정확도 및 하드웨어 비용 측면에서 더 빠른 속도를 보였다. 더불어, 정체성 기반 및 인스턴스 기반의 두 가지 데이터 로더를 효과적으로 설계한 이중 데이터 로더를 도입함으로써, DCP 파라미터 업데이트의 효율성이 더욱 향상되었다.