LFFD: Ein leichter und schneller Face Detector für Edge-Geräte

Gesichtserkennung, als grundlegende Technologie für verschiedene Anwendungen, wird stets auf Edge-Geräten eingesetzt, die begrenztes Speicher- und geringe Rechenleistung haben. In dieser Arbeit wird ein leichter und schneller Gesichtserkennungsdetektor (Light and Fast Face Detector, LFFD) für Edge-Geräte vorgestellt. Das vorgeschlagene Verfahren ist anchor-frei und gehört zur Kategorie der One-Stage-Detektoren. Insbesondere überdenken wir die Bedeutung des Rezeptiven Feldes (Receptive Field, RF) und des effektiven Rezeptiven Feldes (Effective Receptive Field, ERF) im Kontext der Gesichtserkennung. Im Wesentlichen sind die RFs der Neuronen in einer bestimmten Schicht regelmäßig im Eingangsbild verteilt, und diese RFs sind natürliche "Anker". Durch die Kombination von RF-"Anker" und geeigneten RF-Schritten kann das vorgeschlagene Verfahren theoretisch eine große Spannbreite kontinuierlicher Gesichtsskalen mit 100 %iger Abdeckung erkennen. Die tiefgründige Einsicht in die Beziehungen zwischen ERF und Gesichtsskalen motiviert einen effizienten Backbone für One-Stage-Detektion. Der Backbone zeichnet sich durch acht Detektionszweige und gemeinsame Schichten aus, was zu effizienter Berechnung führt. Umfassende Experimente wurden auf gängigen Benchmarks wie WIDER FACE und FDDB durchgeführt. Ein neues Evaluationschema für anwendungsfokussierte Szenarien wird vorgeschlagen. Unter diesem neuen Schema kann das vorgeschlagene Verfahren eine überlegene Genauigkeit erreichen (WIDER FACE Val/Test – Easy: 0,910/0,896, Medium: 0,881/0,865, Hard: 0,780/0,770; FDDB – diskontinuierlich: 0,973, kontinuierlich: 0,724). Mehrere Hardwareplattformen werden eingeführt, um die Laufzeiteffizienz zu bewerten. Das vorgeschlagene Verfahren kann eine schnelle Inferenzgeschwindigkeit erzielen (NVIDIA TITAN Xp: 131,45 FPS bei 640x480; NVIDIA TX2: 136,99 FPS bei 160x120; Raspberry Pi 3 Model B+: 8,44 FPS bei 160x120), wobei die Modellgröße nur 9 MB beträgt.注释:- "anchor-frei" 和 "One-Stage-Detektoren" 是常见的术语,直接使用通用译法。- "Receptive Field" 和 "Effective Receptive Field" 在括号中标注了原文,以确保信息完整。- "FPS"(Frames per Second)在德语中通常也使用英文缩写,因此保留未翻译。