Zur Verbesserung der zeitlichen Konsistenz für Online-Gesichts-Lebendigkeitserkennung

In diesem Paper konzentrieren wir uns darauf, das Online-Gesichts-Lebendigkeitserkennungssystem zu verbessern, um die Sicherheit des nachgeschalteten Gesichtserkennungssystems zu erhöhen. Die meisten bestehenden framebasierten Ansätze leiden unter einer Vorhersageinkonsistenz über die Zeit. Um dieses Problem zu adressieren, wird eine einfache, jedoch effektive Lösung basierend auf zeitlicher Konsistenz vorgeschlagen. Konkret wird im Trainingsstadium zusätzlich zur Softmax-Kreuzentropieloss-Funktion eine zeitliche Selbstüberwachungsverlustfunktion und eine Klassenkonsistenzverlustfunktion eingeführt, um die zeitliche Konsistenz zu integrieren. Im Einsatzstadium wird ein trainingsfreies, parametrisches Unsicherheitsschätzungsmodul entwickelt, das die Vorhersagen adaptiv glättet. Neben dem üblichen Evaluierungsansatz wird ein videosegmentbasiertes Evaluierungsverfahren vorgeschlagen, um realitätsnahere Szenarien besser abzubilden. Umfangreiche Experimente zeigen, dass unsere Lösung robuster gegenüber mehreren Präsentationsangriffen in verschiedenen Szenarien ist und auf mehreren öffentlichen Datensätzen die State-of-the-Art-Methode mindestens um 40 % im Hinblick auf die ACER deutlich übertrifft. Zudem weist sie eine erheblich geringere rechnerische Komplexität auf (33 % weniger FLOPs), was großes Potenzial für latenzarme Online-Anwendungen bietet.