Label-Embedding für die Bildklassifizierung

Attribute dienen als Zwisdarstellungen, die Parameterfreigabe zwischen Klassen ermöglichen, was unerlässlich ist, wenn Trainingsdaten knapp sind. Wir schlagen vor, attributbasierte Bildklassifizierung als ein Problem der Label-Einbettung zu betrachten: Jede Klasse wird im Raum der Attributvektoren eingebettet. Wir führen eine Funktion ein, die die Kompatibilität zwischen einem Bild und einer Label-Einbettung misst. Die Parameter dieser Funktion werden auf einem Trainingsdatensatz von etikettierten Stichproben gelernt, um sicherzustellen, dass bei gegebenem Bild die korrekten Klassen höher rangieren als die inkorrekten. Die Ergebnisse auf den Datensätzen "Animals With Attributes" und "Caltech-UCSD-Birds" zeigen, dass das vorgeschlagene Framework in einem Szenario des Zero-Shot-Learnings die Standardmethode der direkten Attributvorhersage übertrifft. Label-Einbettung verfügt über eine eingebaute Fähigkeit, alternative Informationsquellen neben oder anstelle von Attributen zu nutzen, wie z.B. Klassenhierarchien oder textuelle Beschreibungen. Darüber hinaus umfasst Label-Einbettung das gesamte Spektrum der Lernszenarien vom Zero-Shot-Learning bis hin zum regulären Lernen mit einer großen Anzahl von etikettierten Beispielen.