Aufgabenunterschiedsmaximierung für feinkörnige Few-Shot-Klassifikation

Die Erkennung diskriminativer Details wie Augen und Schnäbel ist entscheidend für die Unterscheidung feinkörniger Klassen, da diese aufgrund ähnlicher Gesamtformen schwer voneinander zu unterscheiden sind. In diesem Zusammenhang stellen wir Task Discrepancy Maximization (TDM) vor, ein einfaches Modul für die feinkörnige Few-Shot-Klassifikation. Unser Ziel besteht darin, diskriminative Regionen pro Klasse zu lokalisieren, indem Kanäle hervorgehoben werden, die charakteristische Informationen der jeweiligen Klasse codieren. Konkret lernt TDM auf der Basis zweier neuer Komponenten task-spezifische Kanalgewichte: den Support Attention Module (SAM) und den Query Attention Module (QAM). Der SAM erzeugt ein Support-Gewicht, das die kanalweise diskriminative Leistung für jede Klasse repräsentiert. Da der SAM jedoch hauptsächlich auf den beschrifteten Support-Sets basiert, ist er anfällig für Verzerrungen hin zu diesen. Um dies zu kompensieren, schlagen wir den QAM vor, der den SAM ergänzt, indem er ein Query-Gewicht liefert, das Kanälen, die für ein bestimmtes Query-Bild relevant sind, höhere Gewichtung verleiht. Durch die Kombination dieser beiden Gewichte wird ein kanal- und klassebezogenes, task-spezifisches Kanalgewicht definiert. Diese Gewichte werden anschließend angewandt, um task-adaptive Merkmalskarten zu erzeugen, die sich stärker auf diskriminative Details konzentrieren. Unsere Experimente bestätigen die Wirksamkeit von TDM und seine ergänzenden Vorteile gegenüber bestehenden Methoden in der feinkörnigen Few-Shot-Klassifikation.