HyperAIHyperAI
vor 2 Monaten

Zu realistischem semi-überwachtem Lernen

Mamshad Nayeem Rizve; Navid Kardan; Mubarak Shah
Zu realistischem semi-überwachtem Lernen
Abstract

Tieflernes (Deep Learning) setzt den Stand der Technik in vielen Anwendungen der Computervision fort. Es basiert jedoch auf umfangreichen annotierten Datensätzen, und das Erfassen der unbeschränkten Natur realweltlicher Daten stellt noch ein ungelöstes Problem dar. Halbüberwachtes Lernen (SSL) ergänzt die annotierten Trainingsdaten mit einem großen Korpus von nicht annotierten Daten, um die Kosten für Annotationen zu reduzieren. Der Standardansatz des SSL geht davon aus, dass die nicht annotierten Daten aus derselben Verteilung stammen wie die annotierten Daten. Kürzlich wurde ein realistischerer SSL-Problemfall eingeführt, der als offene Welt-SSL (open-world SSL) bezeichnet wird, bei dem die nicht annotierten Daten möglicherweise Stichproben unbekannter Klassen enthalten können. In dieser Arbeit schlagen wir einen neuen Ansatz auf Basis von Pseudo-Labels vor, um SSL in einer offenen Weltumgebung zu bewältigen. Im Zentrum unserer Methode steht die Nutzung der Stichprobenunsicherheit und die Einbeziehung vorheriger Kenntnisse über die Klasserverteilung, um verlässliche Klassenerkenntnis-bewusste Pseudo-Labels sowohl für bekannte als auch für unbekannte Klassen zu generieren. Unsere umfangreichen Experimente zeigen die Effektivität unseres Ansatzes an mehreren Benchmark-Datensätzen, wo er erheblich besser abschneidet als der aktuelle Stand der Technik auf sieben verschiedenen Datensätzen, darunter CIFAR-100 (~17 %), ImageNet-100 (~5 %) und Tiny ImageNet (~9 %). Wir betonen zudem die Flexibilität unseres Ansatzes bei der Lösung von Aufgaben zur Entdeckung neuer Klassen, demonstrieren seine Stabilität bei der Verarbeitung unbalancierter Daten und ergänzen unseren Ansatz durch eine Technik zur Schätzung der Anzahl neuer Klassen.

Zu realistischem semi-überwachtem Lernen | Neueste Forschungsarbeiten | HyperAI