ElasticFace: Elastic Margin Loss für die tiefe Gesichtserkennung

Die Entwicklung diskriminativer Gesichtsmerkmale spielt eine zentrale Rolle bei der Konstruktion hochleistungsfähiger Gesichtserkennungsmodelle. Die jüngsten state-of-the-art-Lösungen für die Gesichtserkennung schlagen vor, eine feste Strafmarke auf der üblicherweise verwendeten Klassifikationsverlustfunktion, der Softmax-Verlustfunktion, in der normalisierten Hypersphäre einzuführen, um die Diskriminativkraft der Modelle zu erhöhen, indem die intra-klassen Variation minimiert und die inter-klassen Variation maximiert wird. Marginal-Penalty-Softmax-Verluste wie ArcFace und CosFace gehen davon aus, dass die geodätische Distanz zwischen und innerhalb unterschiedlicher Identitäten mit einer festen Strafmarke gleich gut erlernt werden kann. Dieses Lernziel ist jedoch für reale Datensätze mit inkonsistenter inter- und intra-klassener Variation nicht realistisch und könnte die Diskriminativkraft und Generalisierbarkeit des Gesichtserkennungsmodells einschränken. In diesem Artikel lösen wir die Einschränkung der festen Strafmarke auf, indem wir den elastischen Strafmarke-Verlust (ElasticFace) vorschlagen, der Flexibilität beim Erzwingen der Klassen-Trennbarkeit ermöglicht. Der zentrale Ansatz besteht darin, in jeder Trainingsiteration zufällige Margin-Werte aus einer Normalverteilung zu ziehen. Ziel ist es, der Entscheidungsgrenze die Möglichkeit zu geben, sich flexibel auszubreiten und zurückzuziehen, um Platz für ein flexibles Lernen der Klassen-Trennbarkeit zu schaffen. Wir zeigen die Überlegenheit unseres ElasticFace-Verlustes gegenüber ArcFace und CosFace-Verlusten, jeweils unter Verwendung derselben geometrischen Transformation, an einer großen Anzahl etablierter Benchmarks. In einer breiteren Perspektive hat unser ElasticFace die state-of-the-art-Leistung der Gesichtserkennung auf sieben von neun etablierten Benchmarks weiter verbessert.