HyperAIHyperAI
vor 9 Tagen

Neubewertung klassenbalancierter Methoden für die langschwanzige visuelle Erkennung aus Sicht der Domänenanpassung

Muhammad Abdullah Jamal, Matthew Brown, Ming-Hsuan Yang, Liqiang Wang, Boqing Gong
Neubewertung klassenbalancierter Methoden für die langschwanzige visuelle Erkennung aus Sicht der Domänenanpassung
Abstract

Die Häufigkeit von Objekten in der realen Welt folgt oft einer Potenzgesetzmäßigkeit, was zu einer Diskrepanz zwischen Datensätzen mit langen Schwänzen in der Klassenverteilung, die ein maschinelles Lernmodell sieht, und unserer Erwartung führt, dass das Modell auf allen Klassen gut abschneidet. Wir analysieren diese Diskrepanz aus der Perspektive der Domänenanpassung (domain adaptation). Zunächst verknüpfen wir bestehende, klassenbalancierte Methoden für die Klassifikation mit langen Schwänzen mit dem Konzept des Target Shift, einem gut untersuchten Szenario in der Domänenanpassung. Diese Verknüpfung zeigt, dass diese Methoden implizit davon ausgehen, dass die Trainings- und Testdaten dieselbe klassenbedingte Verteilung aufweisen, was im Allgemeinen nicht zutrifft – insbesondere für die Randklassen (tail classes). Während Kopfklassen (head classes) oft reichhaltige und vielfältige Trainingsbeispiele enthalten, die die erwarteten Daten während der Inferenz gut repräsentieren, fehlen für die Randklassen häufig repräsentative Trainingsdaten. Um dies zu adressieren, schlagen wir vor, das klassische klassenbalancierte Lernen durch eine explizite Schätzung der Unterschiede zwischen den klassenbedingten Verteilungen mittels eines Meta-Lernansatzes zu erweitern. Wir validieren unseren Ansatz anhand sechs Benchmark-Datensätze und drei unterschiedlichen Verlustfunktionen.

Neubewertung klassenbalancierter Methoden für die langschwanzige visuelle Erkennung aus Sicht der Domänenanpassung | Neueste Forschungsarbeiten | HyperAI