Command Palette
Search for a command to run...
Label-Embedding für die Bildklassifikation
Label-Embedding für die Bildklassifikation
Akata Zeynep Perronnin Florent Harchaoui Zaid Schmid Cordelia
Zusammenfassung
Attribute fungieren als intermediäre Darstellungen, die einen Parameter-Sharing zwischen Klassen ermöglichen – eine zwingende Voraussetzung, wenn Trainingsdaten knapp sind. Wir schlagen vor, die attributbasierte Bildklassifikation als ein Label-Embedding-Problem zu betrachten: Jede Klasse wird im Raum von Attributvektoren eingebettet. Wir führen eine Funktion ein, die die Kompatibilität zwischen einem Bild und einer Label-Embedding-Darstellung misst. Die Parameter dieser Funktion werden anhand eines Trainingssets mit beschrifteten Beispielen gelernt, um sicherzustellen, dass bei gegebenem Bild die korrekten Klassen gegenüber den inkorrekten höher rangieren. Experimente an den Datensätzen Animals With Attributes und Caltech-UCSD-Birds zeigen, dass der vorgeschlagene Ansatz im Szenario des Zero-Shot-Lernens die Standardmethode der direkten Attributvorhersage übertrifft. Das Label-Embedding verfügt über eine eingebaute Fähigkeit, alternative Informationsquellen – neben oder anstelle von Attributen – zu nutzen, beispielsweise Klassenhierarchien oder textuelle Beschreibungen. Darüber hinaus umfasst das Label-Embedding den gesamten Spektrum an Lernsituationen – vom Zero-Shot-Lernen bis hin zum regulären Lernen mit einer großen Anzahl an beschrifteten Beispielen.