9일 전

일부 FC: 단일 머신에서 1,000만 개의 정체성 훈련하기

Xiang An, Xuhan Zhu, Yang Xiao, Lan Wu, Ming Zhang, Yuan Gao, Bin Qin, Debing Zhang, Ying Fu
일부 FC: 단일 머신에서 1,000만 개의 정체성 훈련하기
초록

얼굴 인식은 오랫동안 컴퓨터 비전 분야에서 활발하고 핵심적인 연구 주제로 여겨져 왔다. 기존의 연구들은 주로 얼굴 특징 추출 네트워크에 사용되는 손실 함수에 집중해 왔으며, 특히 소프트맥스 기반 손실 함수의 개선이 얼굴 인식 성능을 크게 향상시켰다. 그러나 얼굴 식별자 수의 급격한 증가와 GPU 메모리 부족 사이의 모순은 점점 해결하기 어려운 문제로 대두되고 있다. 본 논문에서는 소프트맥스 기반 손실 함수의 최적화 목표와 대규모 식별자 학습 시의 어려움을 철저히 분석한다. 그 결과, 얼굴 표현 학습에서 소프트맥스 함수 내 음성 클래스(음성 클래스)의 중요도는 기존에 생각했던 것보다 낮다는 것을 발견하였다. 실험 결과, 주요 벤치마크에서 최신 모델을 사용하여 전체 클래스를 이용해 학습하는 것과 비교했을 때, 소프트맥스 기반 손실 함수를 사용할 경우 랜덤으로 10%의 클래스만을 샘플링해도 정확도 손실이 발생하지 않는 것으로 확인되었다. 또한 모델 정확도와 학습 효율성을 고려한 매우 효율적인 분산 샘플링 알고리즘을 구현하였으며, 이는 단 8개의 NVIDIA RTX 2080Ti GPU만으로 수천만 개의 식별자를 포함하는 분류 작업을 완료할 수 있도록 하였다. 본 논문의 코드는 다음 링크에서 공개되어 있다: https://github.com/deepinsight/insightface/tree/master/recognition/partial_fc.

일부 FC: 단일 머신에서 1,000만 개의 정체성 훈련하기 | 최신 연구 논문 | HyperAI초신경