Genaue Gesichtserkennung für hohe Leistung

Das Gesichtserkennungsfeld hat dank der Fortschritte in tiefen Faltungsnetzen (Deep Convolutional Neural Networks, CNNs) erhebliche Fortschritte gemacht. Ein zentrales Problem in den letzten Jahren war die Verbesserung der Erkennungsleistung von kleinen Gesichtern. Um dies zu erreichen, schlagen viele aktuelle Arbeiten spezifische Strategien vor, überarbeiten die Architektur und führen neue Verlustfunktionen für die Erkennung kleiner Objekte ein. In diesem Bericht starten wir mit dem weit verbreiteten One-Stage-RetinaNet-Ansatz und wenden einige jüngste Tricks an, um einen hochleistungsfähigen Gesichtserkennungsdetektor zu entwickeln. Insbesondere verwenden wir die Intersection-over-Union-Verlustfunktion (IoU) für die Regression, setzen eine zweistufige Klassifikation und Regression für die Detektion ein, überarbeiten die Datenverstärkung basierend auf Data-Anchor-Sampling für das Training, nutzen den Max-Out-Vorgang für die Klassifikation und wenden eine mehrskalige Teststrategie für die Inferenz an. Als Ergebnis erreicht das vorgeschlagene Gesichtserkennungsverfahren den aktuellen Stand der Technik auf dem beliebtesten und anspruchsvollsten Gesichtserkennungsbenchmark-Datensatz WIDER FACE.