MobileFaceNets: Effiziente CNNs für genaue Echtzeit-Face-Verification auf mobilen Geräten

Wir präsentieren eine Klasse extrem effizienter CNN-Modelle, die MobileFaceNets genannt werden und weniger als eine Million Parameter verwenden. Diese Modelle sind speziell für hochgenaue Echtzeit-Face-Verification auf mobilen und eingebetteten Geräten entwickelt worden. Zunächst führen wir eine einfache Analyse der Schwächen herkömmlicher mobiler Netze bei der Face-Verification durch. Diese Schwächen wurden durch unsere speziell entwickelten MobileFaceNets gut überwunden. Unter gleichen experimentellen Bedingungen erreichen unsere MobileFaceNets erheblich bessere Genauigkeit sowie mehr als das Doppelte an tatsächlicher Geschwindigkeit im Vergleich zu MobileNetV2. Nach dem Training mit ArcFace-Loss auf dem verfeinerten MS-Celeb-1M erreicht unser einzelnes MobileFaceNet mit einer Größe von 4,0 MB eine Genauigkeit von 99,55 % auf LFW und einen TAR von 92,59 % bei FAR 1e-6 auf MegaFace, was sogar vergleichbar ist mit den besten großen CNN-Modellen, die Hunderte von MB groß sind. Das schnellste der MobileFaceNets hat eine tatsächliche Inferenzzeit von 18 Millisekunden auf einem Mobiltelefon. Bei der Face-Verification zeigen die MobileFaceNets eine erheblich verbesserte Effizienz im Vergleich zu früheren state-of-the-art mobilen CNNs.