HyperAIHyperAI
vor 9 Tagen

Optimaler Transport für long-tailed Recognition mit lernbarem Kostenmatrix

{Ping Li, Mingming Sun, Hanyu Peng}
Optimaler Transport für long-tailed Recognition mit lernbarem Kostenmatrix
Abstract

Es wird auf das Problem der langschwänzigen Erkennung aufmerksam gemacht, ein aktuelles und zunehmend populäres Thema. Im Gegensatz zur herkömmlichen Erkennung geht diese Aufgabe davon aus, dass die Verteilung des Trainingsdatensatzes stark verzerrt ist, während Validierungs- und Testdatensätze balanciert sind. Vorhersehbar ergeben sich hieraus erhebliche Herausforderungen für das Generalisierungsverhalten des Modells aufgrund des Verteilungsverschiebungsproblems zwischen Trainings- und Testdaten. Die Ansätze zur Bewältigung dieser Herausforderung lassen sich in zwei Gruppen einteilen: Erstens Methoden, die während des Trainings berücksichtigt werden (training-aware), die darauf abzielen, die Generalisierbarkeit des Modells durch Ausnutzung seines Potenzials im Trainingsprozess zu verbessern; zweitens Nachbearbeitungsverfahren (post-hoc correction), die weitgehend mit training-aware-Methoden kombiniert werden und darauf abzielen, die Vorhersagen im Nachbearbeitungsschritt so präzise wie möglich zu verfeinern – mit den Vorteilen von Einfachheit und Effektivität. In diesem Artikel stellen wir eine alternative Herangehensweise an die Nachbearbeitung vor, die über herkömmliche statistische Methoden hinausgeht. Mathematisch betrachten wir das Problem aus der Perspektive der optimalen Transporttheorie (Optimal Transport, OT). Allerdings ist die Wahl der exakten Kostenmatrix bei der Anwendung von OT herausfordernd und erfordert spezialisiertes Fachwissen für verschiedene Aufgaben. Um diese Einschränkung zu überwinden, schlagen wir vor, eine lineare Abbildung zu nutzen, um die Kostenmatrix adaptiv zu lernen, ohne dass vorherige Einstellungen notwendig sind. In praktischen Tests zeigen unsere Experimente, dass unsere Methode neben hoher Effizienz und herausragender Leistung alle bisherigen Ansätze übertrifft und derzeit die beste Leistung erzielt.

Optimaler Transport für long-tailed Recognition mit lernbarem Kostenmatrix | Neueste Forschungsarbeiten | HyperAI