RetinaFace: Einstufige dichte Gesichtslokalisierung im Freien

Obwohl große Fortschritte bei der unkontrollierten Gesichtserkennung gemacht wurden, bleibt die genaue und effiziente Gesichtslokalisation in der freien Natur eine offene Herausforderung. In dieser Arbeit wird ein robustes Einzelschritt-Gesichtserkennungsverfahren vorgestellt, das unter dem Namen RetinaFace firmiert und durch die Nutzung von zusätzlicher überwachter und selbstüberwachter Mehrfachaufgabenlernen (multi-task learning) eine pixelweise Gesichtslokalisation auf verschiedenen Skalen ermöglicht.Speziell leisten wir Beiträge in den folgenden fünf Aspekten:(1) Wir haben manuell fünf Gesichtspunkte im WIDER FACE-Datensatz annotiert und beobachten mit Hilfe dieses zusätzlichen Überwachungssignals eine erhebliche Verbesserung bei der schwierigen Gesichtserkennung.(2) Wir fügen außerdem einen selbstüberwachten Mesh-Decodierzweig hinzu, um neben den bestehenden überwachten Zweigen parallele Vorhersagen von pixelweiser 3D-Gesichtsforminformationen zu ermöglichen.(3) Auf dem WIDER FACE-Schwierigkeitstestset übertreffen RetinaFace die aktuellen besten Durchschnittsgenauigkeiten (Average Precision, AP) um 1,1 % (mit einer erreichten AP von 91,4 %).(4) Auf dem IJB-C-Testset ermöglicht RetinaFace es den besten Methoden (z.B. ArcFace), ihre Ergebnisse in der Gesichtsverifizierung zu verbessern (TAR = 89,59 % für FAR = 1e-6).(5) Durch die Verwendung leichtgewichtiger Backbone-Netze kann RetinaFace in Echtzeit auf einem einzelnen CPU-Kern für ein VGA-Auflösungs-Bild laufen.Zusätzliche Annotationen und Code sind unter folgender URL verfügbar: https://github.com/deepinsight/insightface/tree/master/RetinaFace.