Zielgerichtete überwachte kontrastive Lernverfahren für die Langschwanz-Recognition

Realwelt-Daten weisen häufig Long-Tail-Verteilungen mit starker Klassenungleichgewicht auf, wobei die überwiegenden Klassen den Trainingsprozess dominieren und die Entscheidungsgrenzen der Minderheitsklassen verzerren können. In jüngster Zeit haben Forscher das Potenzial des überwachten kontrastiven Lernens für die Erkennung bei Long-Tail-Verteilungen untersucht und gezeigt, dass es zu einer erheblichen Leistungssteigerung führt. In diesem Artikel zeigen wir, dass obwohl das überwachte kontrastive Lernen die Leistung verbessern kann, bestehende Baselines aufgrund der ungleichmäßigen Datenverteilung unter schlechter Uniformität leiden. Diese mangelhafte Uniformität äußert sich darin, dass Proben aus den Minderheitsklassen im Merkmalsraum eine schlechte Trennbarkeit aufweisen. Um dieses Problem zu lösen, schlagen wir ein gezielt ausgerichtetes überwachtes kontrastives Lernen (Targeted Supervised Contrastive Learning, TSC) vor, das die Uniformität der Merkmalsverteilung auf der Hypersphäre verbessert. TSC generiert zunächst eine Menge von Zielpunkten, die gleichmäßig auf einer Hypersphäre verteilt sind. Während des Trainings werden dann die Merkmale verschiedener Klassen dazu gebracht, sich diesen unterschiedlichen und gleichmäßig verteilten Zielpunkten anzunähern. Dadurch wird sichergestellt, dass alle Klassen – einschließlich der Minderheitsklassen – eine gleichmäßige Verteilung im Merkmalsraum beibehalten, die Klassengrenzen werden verbessert, und eine bessere Generalisierung erreicht, selbst bei Long-Tail-Daten. Experimente auf mehreren Datensätzen zeigen, dass TSC die derzeit beste Leistung bei Aufgaben der Long-Tail-Erkennung erzielt.