Additiver Margin-Softmax für die Gesichtserkennung

In dieser Arbeit schlagen wir eine konzeptionell einfache und geometrisch interpretierbare Zielfunktion vor, nämlich das additive Margin Softmax (AM-Softmax), für die tiefen Gesichtserkennung. Im Allgemeinen kann die Gesichtserkennungsaufgabe als ein Problem des Metrik-Learnings betrachtet werden. Daher ist es von großer Bedeutung, große Margen in den Gesichtsmerkmalen zu lernen, bei denen die innerklassische Variation gering und die zwischenklassliche Differenz groß ist, um gute Ergebnisse zu erzielen. Kürzlich wurden Large-margin Softmax und Angular Softmax vorgeschlagen, um den Winkel-Margin multiplikativ einzubeziehen. In dieser Arbeit führen wir einen neuen additiven Winkel-Margin für den Softmax-Verlust ein, der intuitiver und besser interpretierbar ist als bisherige Arbeiten. Wir betonen auch und diskutieren die Bedeutung der Merkmalsnormalisierung in der Arbeit. Am wichtigsten jedoch zeigen unsere Experimente auf LFW BLUFR und MegaFace, dass unser additiver Margin-Softmax-Verlustverfahren konsistent bessere Ergebnisse liefert als die aktuellen Stand-of-the-Art-Methoden unter Verwendung derselben Netzarchitektur und Trainingsdatensatzes. Unser Code ist ebenfalls unter https://github.com/happynear/AMSoftmax verfügbar.