HyperAIHyperAI
vor 2 Monaten

QCS: Merkmalsverfeinerung durch Quadrupel-Kreuzähnlichkeit für die Gesichtsausdrerkennung

Wang, Chengpeng ; Chen, Li ; Wang, Lili ; Li, Zhaofan ; Lv, Xuebin
QCS: Merkmalsverfeinerung durch Quadrupel-Kreuzähnlichkeit für die Gesichtsausdrerkennung
Abstract

Die Erkennung von Gesichtsausdrücken steht vor der Herausforderung, dass in Datensätzen beschriftete relevante Merkmale mit unbeschrifteten überflüssigen Merkmalen vermischt sind. In dieser Arbeit stellen wir die Cross Similarity Attention (CSA) vor, um reichhaltigere intrinsische Informationen aus Bildpaaren zu gewinnen und damit eine Einschränkung zu überwinden, die entsteht, wenn die skalierte Punktmultiplikationsaufmerksamkeit (Scaled Dot-Product Attention) des Vision Transformers (ViT) direkt zur Berechnung der Ähnlichkeit zwischen zwei verschiedenen Bildern angewendet wird. Basierend auf CSA minimieren wir gleichzeitig innerklassische Unterschiede und maximieren interklassische Unterschiede auf der Ebene feingranularer Merkmale durch Interaktionen zwischen mehreren Zweigen. Kontrastiver Residual-Distillation wird verwendet, um das in dem Kreuzmodul gelernte Wissen zurück in das Basisnetzwerk zu transferieren. Wir haben kreativ ein vierzweiges zentral symmetrisches Netzwerk konzipiert, das Quadruplet Cross Similarity (QCS) genannt wird. Dieses Netzwerk lindert Gradientenkonflikte, die durch das Kreuzmodul entstehen, und erreicht ausgewogenes und stabiles Training. Es kann diskriminative Merkmale anpassungsfähig extrahieren, während es überflüssige Merkmale isoliert. Die Kreuz-Aufmerksamkeitsmodule existieren während des Trainings, und nur ein Basiszweig bleibt während der Inferenz erhalten, was eine Verlängerung der Inferenzzeit vermeidet. Umfangreiche Experimente zeigen, dass unser vorgeschlagenes Verfahren den Stand der Technik auf mehreren FER-Datensätzen erreicht.请注意,这里将“Facial Expression Recognition”翻译为“Erkennung von Gesichtsausdrücken”,这是德语中常用的术语。其他专业术语也尽量采用了通用的德语译法。如果有特定的术语需要特别处理,请告知我。