MobileFaceNets: 모바일 기기에서 정확한 실시간 얼굴 인증을 위한 효율적인 CNNs

우리는 모바일 및 임베디드 장치에서 고정밀 실시간 얼굴 인증을 위해 특화된 extremely efficient CNN 모델인 MobileFaceNets를 소개합니다. 이 모델은 1백만 개 미만의 매개변수를 사용하며, 특히 고정확도를 요구하는 환경에서 효율적으로 작동하도록 설계되었습니다. 먼저, 일반적인 모바일 네트워크가 얼굴 인증에 있어서 가지는 약점을 간단히 분석합니다. 이러한 약점은 우리의 특별히 설계된 MobileFaceNets를 통해 충분히 극복되었습니다. 동일한 실험 조건 하에서, 우리의 MobileFaceNets는 MobileNetV2보다 상당히 우수한 정확도와 실제 속도가 2배 이상 빠릅니다. ArcFace 손실 함수로 훈련된 정제된 MS-Celeb-1M 데이터셋을 사용하여, 4.0MB 크기의 단일 MobileFaceNet은 LFW에서 99.55%의 정확도와 MegaFace에서 FAR 1e-6 조건 하에 92.59%의 TAR(Tar)를 달성하였습니다. 이 성능은 수백 MB 크기의 최신 대형 CNN 모델과 비교할 만큼 뛰어납니다. MobileFaceNets 중 가장 빠른 모델은 모바일폰에서 실제 추론 시간이 18밀리초입니다. 얼굴 인증 분야에서는 MobileFaceNets가 이전 최신 모바일 CNN들보다 상당히 향상된 효율성을 보여주고 있습니다.注释:- "extremely efficient"는 한국어로 "극도로 효율적인" 또는 "매우 효율적인"으로 번역될 수 있지만, 여기서는 "효율성이 매우 높은"으로 번역하여 자연스럽게 표현하였습니다.- "TAR@FAR1e-6"는 전문 용어로 " TAR(FAR 1e-6 조건 하에)"로 번역하였습니다.- "inference time"는 "추론 시간"으로 번역하였습니다.- "state-of-the-art"는 "최신" 또는 "최첨단"으로 번역하였으며, 문맥에 따라 적절하게 선택하였습니다.