Zero-Shot Logit-Anpassung

Semantik-basierte Generalized Zero-Shot Learning (GZSL) stellt Herausforderungen bei der Erkennung neuer Klassen im Testphase dar. Die Entwicklung generativer Modelle ermöglicht es aktuellen GZSL-Techniken, die Verbindung zwischen Semantik und Visualisierung tiefer zu erforschen, was zu einer zweistufigen Architektur führt, die aus einem Generator und einem Klassifikator besteht. Allerdings legen bestehende generative Ansätze den Fokus auf die Verbesserung des Generators, während die Optimierung des Klassifikators vernachlässigt wird. In diesem Paper analysieren wir zunächst zwei Eigenschaften der generierten Pseudounbekannten-Samples: Bias und Homogenität. Anschließend führen wir eine variational Bayes-Inferenz durch, um Bewertungsmetriken zurückzuleiten, die das Gleichgewicht zwischen bekannten und unbekannten Klassen widerspiegeln. Als Folge dieser Ableitung werden die oben genannten beiden Eigenschaften im Klassifikatortraining als sichtbare-unbekannte Prior-Informationen über eine Logit-Anpassung integriert. Die Zero-Shot Logit Adjustment ermöglicht es nun, semantikbasierte Klassifikatoren effektiv in generative GZSL-Ansätze einzubinden. Unsere Experimente zeigen, dass die vorgeschlagene Methode, kombiniert mit einem grundlegenden Generator, den Stand der Technik erreicht und verschiedene generative Zero-Shot Learning-Frameworks verbessern kann. Unsere Quellcode-Implementierung ist unter https://github.com/cdb342/IJCAI-2022-ZLA verfügbar.