HyperAIHyperAI
vor 2 Monaten

Offene-Welt Halbüberwachtes Lernen

Cao, Kaidi ; Brbic, Maria ; Leskovec, Jure
Offene-Welt Halbüberwachtes Lernen
Abstract

Eine grundlegende Einschränkung der Anwendung von semiaufgeklärtem Lernen in realen Szenarien ist die Annahme, dass nicht gekennzeichnete Testdaten nur Klassen enthalten, die bereits in den gekennzeichneten Trainingsdaten vorgekommen sind. Diese Annahme gilt jedoch selten für Daten aus der Praxis, bei denen Instanzen zu neuen Klassen während des Testens auftreten können. Hier stellen wir eine neuartige offene Welt-Semiaufklärungslernsituation vor, die das Konzept formalisiert, dass neue Klassen in den nicht gekennzeichneten Testdaten auftreten können. In dieser neuen Situation besteht das Ziel darin, die Klassendistributionsungleichheit zwischen gekennzeichneten und nicht gekennzeichneten Daten zu lösen, sodass jede Eingabeinstanz während des Testens entweder einer der existierenden Klassen zugeordnet werden muss oder eine neue unbekannte Klasse initialisiert werden muss. Um dieses anspruchsvolle Problem anzugehen, schlagen wir ORCA vor, einen end-to-end Tiefenlernansatz, der ein Unsicherheitsadaptives Marginalmechanismus (uncertainty adaptive margin mechanism) einführt, um den Bias zugunsten bereits gesehener Klassen zu umgehen, der durch das schnellere Lernen diskriminativer Merkmale für gesehene Klassen im Vergleich zu neuen Klassen entsteht. Auf diese Weise verringert ORCA die Differenz zwischen der innerklassischen Varianz von gesehenen und neuen Klassen. Experimente auf Bildklassifikationsdatensätzen und einem Datensatz zur Annotation einzelner Zellen zeigen, dass ORCA konsistent bessere Ergebnisse als alternative Baseline-Methoden erzielt und eine Verbesserung von 25 % bei gesehenen und 96 % bei neuen Klassen des ImageNet-Datensatzes erreicht.

Offene-Welt Halbüberwachtes Lernen | Neueste Forschungsarbeiten | HyperAI