HyperAIHyperAI
vor 8 Tagen

Generierung von Merkmalen für Long-tail-Klassifikation

Rahul Vigneswaran, Marc T. Law, Vineeth N. Balasubramanian, Makarand Tapaswi
Generierung von Merkmalen für Long-tail-Klassifikation
Abstract

Die visuelle Welt zeigt naturgemäß eine Ungleichverteilung der Anzahl von Objekt- oder Szeneninstanzen, was zu einer \emph{langen Schwanzverteilung} (long-tailed distribution) führt. Diese Ungleichverteilung stellt erhebliche Herausforderungen für Klassifizierungsmodelle auf Basis tiefer neuronalen Netze dar. Die Überproportionale Vergrößerung der Instanzen der sogenannten „Schwanzklassen“ (tail classes) versucht, diese Ungleichgewichtssituation zu beheben. Allerdings führt die begrenzte visuelle Vielfalt dieser überproportionalen Stichproben zu einem Netzwerk mit schlechter Repräsentationsfähigkeit. Ein einfacher Gegenmaßnahmenansatz besteht darin, das Repräsentations- und das Klassifikationsnetzwerk zu entkoppeln und die Überproportionale Vergrößerung ausschließlich zur Schulung des Klassifikators zu nutzen. In diesem Artikel verfolgen wir stattdessen einen Ansatz, der darauf abzielt, sinnvolle Merkmale zu erzeugen, indem die Verteilung der Schwanzklassen geschätzt wird. Inspiriert durch Ansätze aus der jüngsten Forschung zum Few-Shot-Lernen, erzeugen wir kalibrierte Verteilungen, um zusätzliche Merkmale zu sampling, die anschließend zur Schulung des Klassifikators verwendet werden. Durch mehrere Experimente auf dem CIFAR-100-LT-(long-tail)-Datensatz mit unterschiedlichen Ungleichgewichtsfaktoren sowie auf mini-ImageNet-LT (long-tail) zeigen wir die Wirksamkeit unseres Ansatzes und etablieren eine neue State-of-the-Art-Leistung. Zudem präsentieren wir eine qualitative Analyse der generierten Merkmale mittels t-SNE-Darstellungen und untersuchen die nächsten Nachbarn, die zur Kalibrierung der Verteilungen der Schwanzklassen herangezogen wurden. Unser Quellcode ist unter https://github.com/rahulvigneswaran/TailCalibX verfügbar.