HyperAIHyperAI
vor 2 Monaten

Parametrische Klassifikation für verallgemeinerte Kategorienentdeckung: Eine Baseline-Studie

Xin Wen; Bingchen Zhao; Xiaojuan Qi
Parametrische Klassifikation für verallgemeinerte Kategorienentdeckung: Eine Baseline-Studie
Abstract

Die Generalisierte Kategorienentdeckung (GCD) strebt danach, neue Kategorien in ungelabelten Datensätzen mithilfe von Wissen, das aus gelabelten Stichproben gelernt wurde, zu entdecken. Frühere Studien argumentierten, dass parametrische Klassifizierer neigen, sich an die bekannten Kategorien anzupassen, und befürworteten die Verwendung eines nichtparametrischen Klassifizierers, der mit halbüberwachten k-Means gebildet wird. In dieser Studie untersuchen wir jedoch den Misserfolg parametrischer Klassifizierer, überprüfen die Effektivität früherer Designentscheidungen bei verfügbarem hochwertigem Überwachungsdaten und identifizieren nicht zuverlässige Pseudolabels als ein zentrales Problem. Wir zeigen, dass zwei Vorhersageverzerrungen existieren: Der Klassifizierer neigt dazu, bekannte Klassen häufiger vorherzusagen und erzeugt eine ungleichmäßige Verteilung zwischen bekannten und neuen Kategorien. Auf Basis dieser Erkenntnisse schlagen wir eine einfache aber effektive parametrische Klassifikationsmethode vor, die von der Entropieregularisierung profitiert. Diese Methode erreicht den aktuellen Stand der Technik auf mehreren GCD-Benchmarks und zeigt eine starke Robustheit gegenüber unbekannten Anzahlen von Klassen. Wir hoffen, dass unsere Untersuchung und das vorgeschlagene einfache Framework als stabile Grundlage für zukünftige Studien in diesem Bereich dienen können. Unser Code ist unter folgendem Link verfügbar: https://github.com/CVMI-Lab/SimGCD.

Parametrische Klassifikation für verallgemeinerte Kategorienentdeckung: Eine Baseline-Studie | Neueste Forschungsarbeiten | HyperAI