DSFD: Dual Shot Face Detector DSFD: Doppelschuss-Gesichtserkennung

In dieser Arbeit schlagen wir ein neues Gesichtserkennungsnetzwerk vor, das drei innovative Beiträge leistet, die sich auf drei entscheidende Aspekte der Gesichtserkennung konzentrieren: verbessertes Merkmalslernen, fortschreitende Verlustfunktionsentwurf und ankerbasierte Datenverstärkung. Erstens entwickeln wir ein Merkmalsextraktionsmodul (Feature Enhance Module, FEM), um die ursprünglichen Merkmalskarten zu verbessern und den Einsschussdetektor in einen Doppelschussdetektor zu erweitern. Zweitens verwenden wir eine fortschreitende Anker-Verlustfunktion (Progressive Anchor Loss, PAL), die durch zwei verschiedene Ankersätze berechnet wird, um die Merkmale effektiv zu unterstützen. Drittens integrieren wir eine verbesserte Ankerzuordnung (Improved Anchor Matching, IAM) in die Datenverstärkung, um dem Regressor eine bessere Initialisierung zu bieten. Da diese Techniken alle mit dem Zweiströmdesign zusammenhängen, bezeichnen wir das vorgeschlagene Netzwerk als Doppelschuss-Gesichtserkennungsdetektor (Dual Shot Face Detector, DSFD). Ausführliche Experimente auf gängigen Benchmarks wie WIDER FACE und FDDB zeigen die Überlegenheit des DSFD im Vergleich zu den bislang besten Gesichtserkennungsdetektoren.