Mehrskaliges fördertes selbstanpassendes Korrelationslernen für die Erkennung von Gesichtsausdrucks-Einheiten

Die Erkennung von Gesichtsausdrucks-Einheiten (AUs) ist eine entscheidende Aufgabe im Bereich der affektiven Informatik und sozialen Robotik, da sie hilft, Emotionen zu identifizieren, die durch Mimik ausgedrückt werden. Anatomisch gesehen gibt es unzählige Korrelationen zwischen AUs, die reichhaltige Informationen enthalten und für die Erkennung von AUs von großer Bedeutung sind. Frühere Methoden nutzten feste AU-Korrelationen, die auf Expertenerfahrung oder statistischen Regeln basierten und spezifische Benchmarks verwendeten. Allerdings ist es schwierig, komplexe Korrelationen zwischen AUs durch manuell erstellte Einstellungen umfassend widerzuspiegeln. Es gibt alternative Ansätze, die einen vollständig vernetzten Graphen verwenden, um diese Abhängigkeiten erschöpfend zu lernen. Diese Methoden können jedoch zu einem Rechenaufwandsexplosion führen und stark von großen Datensätzen abhängig sein. Um diese Herausforderungen zu bewältigen, schlägt dieser Artikel eine neuartige Methode zur selbstanpassenden AU-Korrelationslernen (SACL) vor, die weniger Rechenleistung für die AU-Erkennung benötigt. Diese Methode lernt und aktualisiert AU-Korrelationsgraphen anpassungsfähig, indem sie effizient die Merkmale verschiedener Bewegungs- und Emotionsrepräsentationsebenen nutzt, die in verschiedenen Stufen des Netzwerks extrahiert werden. Darüber hinaus untersucht dieser Artikel die Rolle des mehrskaligen Lernens bei der Extraktion von Korrelationsinformationen und entwickelt eine einfache aber effektive Methode zum mehrskaligen Feature-Lernen (MSFL), um bessere Ergebnisse bei der AU-Erkennung zu erzielen. Durch die Integration von AU-Korrelationsinformationen mit mehrskaligen Features erhält das vorgeschlagene Verfahren eine robustere Merkmalsrepräsentation für die endgültige AU-Erkennung. Ausführliche Experimente zeigen, dass das vorgeschlagene Verfahren den aktuellen Stand der Technik auf weit verbreiteten Benchmark-Datensätzen für AU-Erkennung übertrifft, wobei es nur 28,7 % und 12,0 % der Parameter und FLOPs des besten Verfahrens benötigt. Der Quellcode für dieses Verfahren ist unter \url{https://github.com/linuxsino/Self-adjusting-AU} verfügbar.