Command Palette
Search for a command to run...
L2-beschränkter Softmax-Verlust für diskriminative Gesichtserkennung
L2-beschränkter Softmax-Verlust für diskriminative Gesichtserkennung
Rajeev Ranjan Carlos D. Castillo Rama Chellappa
Zusammenfassung
In den letzten Jahren hat sich die Leistung von Gesichtserkennungssystemen durch den Einsatz tiefer Faltungsneuronaler Netze (DCNNs) erheblich verbessert. Ein typischer Workflow für die Gesichtserkennung umfasst das Training eines tiefen Netzes zur Klassifikation von Subjekten unter Verwendung der Softmax-Verlustfunktion, das Nutzen des Vorletzten-Layer-Ausgangs als Merkmalsdeskriptor und die Generierung eines Kosinusähnlichkeitswerts für ein Paar von Gesichtsbildern. Die Softmax-Verlustfunktion optimiert die Merkmale jedoch nicht so, dass sie für positive Paare einen höheren Ähnlichkeitswert und für negative Paare einen niedrigeren Ähnlichkeitswert aufweisen, was zu einer Leistungsunterschied führt. In dieser Arbeit fügen wir den Merkmalsdeskriptoren eine L2-Nebenbedingung hinzu, die sie auf eine Hypersphäre mit festem Radius beschränkt. Dieses Modul kann leicht mit bestehenden tiefen Lernframeworks implementiert werden. Wir zeigen, dass die Integration dieses einfachen Schritts in den Trainingsworkflow die Leistung der Gesichtserkennung erheblich steigert. Insbesondere erreichen wir Spitzenwerte auf dem anspruchsvollen IJB-A-Datensatz, mit einem Wahre-Akzeptanzrate von 0,909 bei einer Falsche-Akzeptanzrate von 0,0001 im Gesichtserkennungsprotokoll. Zudem erzielen wir Spitzenleistungen auf dem LFW-Datensatz mit einer Genauigkeit von 99,78 % und vergleichbare Ergebnisse auf dem YTF-Datensatz mit einer Genauigkeit von 96,08 %.