Ein schneller und genauer unbegrenzter Gesichtserkennungsdetektor

Wir schlagen eine Methode vor, um Herausforderungen bei der unbeschränkten Gesichtserkennung anzugehen, wie z.B. beliebige Posevariationen und Verdeckungen. Zunächst wird ein neues Bildmerkmal namens Normalisierte Pixeldifferenz (NPD) vorgeschlagen. Die NPD-Feature werden als das Differenz-zu-Summen-Verhältnis zwischen zwei Pixelwerten berechnet, inspiriert durch den Weber-Faktor in der experimentellen Psychologie. Das neue Merkmal ist skaleninvariant, begrenzt und ermöglicht die Rekonstruktion des ursprünglichen Bildes. Zweitens schlagen wir einen tiefen quadratischen Baum vor, um die optimale Teilmenge von NPD-Features und deren Kombinationen zu lernen, sodass komplexe Gesichtsmanigfaltigkeiten durch die gelernten Regeln partitioniert werden können. Auf diese Weise ist nur ein einzelner Soft-Cascade-Klassifikator erforderlich, um die unbeschränkte Gesichtserkennung zu bewältigen. Darüber hinaus zeigen wir, dass die NPD-Features effizient aus einer Nachschlagetabelle abgerufen werden können und dass das Erkennungsvorlage leicht skaliert werden kann, was den vorgeschlagenen Gesichtserkenner sehr schnell macht. Experimentelle Ergebnisse an drei öffentlichen Gesichtsdatensätzen (FDDB, GENKI und CMU-MIT) zeigen, dass die vorgeschlagene Methode den Stand der Technik in der Erkennung von unbeschränkten Gesichtern mit beliebigen Posevariationen und Verdeckungen in komplexen Szenen erreicht.请注意,这里将“look up table”翻译为“Nachschlagetabelle”,这是德语中常用的术语。如果需要保留英文原词,可以在括号中标注原文,例如:“Nachschlagetabelle (look up table)”。