Pose-Robuste Gesichtserkennung durch Tiefes Residuelles Äquivariantes Abbildung

Das Gesichtserkennungssystem erzielt außergewöhnliche Erfolge dank der Einführung des tiefen Lernens. Dennoch zeigen viele moderne Gesichtserkennungsmodelle bei der Verarbeitung von Profilgesichtern im Vergleich zu Frontalgesichtern immer noch relativ schlechte Leistungen. Ein wesentlicher Grund dafür ist die starke Ungleichverteilung der Anzahl von Frontal- und Profilgesichtern in den Trainingsdaten – es gibt deutlich mehr Frontalgesichter als Profilgesichter. Zudem ist es intrinsisch schwierig, eine tiefe Darstellung zu lernen, die geometrisch invariant gegenüber großen Pose-Variationen ist. In dieser Studie gehen wir davon aus, dass zwischen Frontal- und Profilgesichtern eine inhärente Abbildung besteht, und dass ihre Diskrepanz im Raum der tiefen Darstellungen durch eine äquivariante Abbildung überbrückt werden kann. Um diese Abbildung zu nutzen, formulieren wir einen neuen Deep Residual EquivAriant Mapping (DREAM)-Block, der in der Lage ist, adaptive Residuen zur Eingabedarstellung hinzuzufügen, um eine Profildarstellung in eine kanonische Pose zu transformieren, die die Erkennung vereinfacht. Der DREAM-Block verbessert die Leistungsfähigkeit der Profilerkennung konsistent für viele leistungsfähige tiefere Netzwerke, einschließlich ResNet-Modelle, ohne dass Trainingsdaten von Profilgesichtern gezielt erweitert werden müssen. Der Block ist einfach zu verwenden, leichtgewichtig und kann mit einem vernachlässigbaren Rechenaufwand implementiert werden.