HyperAIHyperAI
vor 17 Tagen

PAtt-Lite: Lightweight Patch and Attention MobileNet für anspruchsvolle Gesichtsausdruckserkennung

Jia Le Ngwe, Kian Ming Lim, Chin Poo Lee, Thian Song Ong
PAtt-Lite: Lightweight Patch and Attention MobileNet für anspruchsvolle Gesichtsausdruckserkennung
Abstract

Die Gesichtsausdruckserkennung (Facial Expression Recognition, FER) ist ein maschinelles Lernproblem, das sich mit der Erkennung menschlicher Gesichtsausdrücke befasst. Obwohl in jüngster Zeit durch bestehende Ansätze Leistungssteigerungen erzielt wurden, bleibt die FER unter realen, herausfordernden Bedingungen – sogenannte „in the wild“-Szenarien – weiterhin eine große Herausforderung. In diesem Artikel wird ein leichtgewichtiger Patch- und Aufmerksamkeitsnetzwerk vorgestellt, das auf MobileNetV1 basiert und als PAtt-Lite bezeichnet wird, um die FER-Leistung unter schwierigen Bedingungen zu verbessern. Als Grundlage dient ein abgeschnittener, auf ImageNet vortrainierter MobileNetV1, der als Feature-Extractor fungiert. Anstelle der abgeschnittenen Schichten wird ein neuartiger Patch-Extraktionsblock eingeführt, der gezielte lokale Gesichtsmerkmale extrahiert, um die Merkmalsrepräsentation von MobileNetV1 insbesondere unter schwierigen Bedingungen zu verstärken. Zusätzlich wird ein Aufmerksamkeits-Klassifikator vorgeschlagen, um das Lernen der patchbasierten Merkmalskarten aus dem äußerst leichtgewichtigen Feature-Extractor zu optimieren. Die experimentellen Ergebnisse auf öffentlichen Benchmark-Datenbanken belegen die Wirksamkeit des vorgeschlagenen Ansatzes. PAtt-Lite erreicht state-of-the-art-Ergebnisse auf CK+, RAF-DB, FER2013, FERPlus sowie auf den herausfordernden Untergruppen von RAF-DB und FERPlus.