SFace: Sigmoid-beschränkter Hyperkugelverlust für robuste Gesichtserkennung

Tiefes Gesichtserkennung hat aufgrund umfangreicher Trainingsdatenbanken und rasch entwickelter Verlustfunktionen große Erfolge erzielt. Die bestehenden Algorithmen widmen sich der Realisierung einer idealen Idee: die Minimierung des innerklassischen Abstands und die Maximierung des zwischenklassischen Abstands. Allerdings können sie dabei übersehen, dass es auch niedriger Qualität besitzende Trainingsbilder gibt, die nicht auf diese strenge Weise optimiert werden sollten. Angesichts der Unvollkommenheit von Trainingsdatenbanken schlagen wir vor, dass innerklassische und zwischenklassische Ziele auf eine moderate Weise optimiert werden können, um das Problem des Überanpassens zu mildern. Wir stellen ferner eine neuartige Verlustfunktion vor, die als sigmoid-begrenzter Hypersphärenverlust (SFace) bezeichnet wird. Speziell legt SFace innerklassische und zwischenklassische Beschränkungen auf einer Hypersphäre-Manifold fest, die jeweils durch zwei sigmoid-Gradienten-Reskalierungsfunktionen gesteuert werden. Die Sigmoid-Kurven reskalieren die innerklassischen und zwischenklassischen Gradienten präzise, sodass Trainingsbeispiele bis zu einem gewissen Grad optimiert werden können. Daher kann SFace ein besseres Gleichgewicht zwischen der Verringerung der innerklassischen Abstände für saubere Beispiele und dem Verhindern des Überanpassens an Etikett-Rauschen schaffen und robustere tiefgreifende Gesichtserkennungsmodelle beitragen. Ausführliche Experimente mit Modellen, die auf den Datenbanken CASIA-WebFace, VGGFace2 und MS-Celeb-1M trainiert wurden, und an mehreren Gesichtserkennungsbenchmarks evaluiert wurden, wie z.B. den LFW-, MegaFace- und IJB-C-Datenbanken, haben die Überlegenheit von SFace nachgewiesen.