Git-Loss für Tiefes Gesichtserkennung

Faltungsschichtneuronale Netze (CNNs) werden häufig in Computer Vision-Aufgaben wie Gesichtserkennung und -verifikation eingesetzt und haben aufgrund ihrer Fähigkeit, diskriminierende tiefere Merkmale zu erfassen, Stand-der-Technik-Ergebnisse erzielt. Traditionell wurden CNNs mit dem Softmax als Supervisionsignal trainiert, um den Klassifizierungsverlust zu bestrafen. Um die diskriminierende Leistungsfähigkeit der tiefen Merkmale weiter zu verbessern, führen wir ein gemeinsames Supervisionsignal ein, das Git-Verlust genannt wird und sowohl auf Softmax als auch auf Center-Loss-Funktionen basiert. Das Ziel unserer Verlustfunktion ist es, die innerklassischen Variationen zu minimieren und gleichzeitig die zwischenklasslichen Abstände zu maximieren. Diese Minimierung und Maximierung der tiefen Merkmale gilt als ideal für die Gesichtserkennung. Wir führen Experimente an zwei gängigen Gesichtserkennungs-Benchmark-Datensätzen durch und zeigen, dass unser vorgeschlagener Verlustfunktion die maximale Trennbarkeit zwischen den tiefen Gesichtsmerkmalen verschiedener Identitäten erreicht und Stand-der-Technik-Genauigkeit auf den beiden wichtigsten Gesichtserkennungs-Benchmark-Datensätzen erzielt: Labeled Faces in the Wild (LFW) und YouTube Faces (YTF). Es sollte jedoch hervorgehoben werden, dass das Hauptziel des Git-Verlustes darin besteht, die maximale Trennbarkeit zwischen den tiefen Merkmalen unterschiedlicher Identitäten zu erreichen.