HyperAIHyperAI

Command Palette

Search for a command to run...

Unüberwachte selektive Beschriftung für effektiveres semisupervises Lernen

Xudong Wang Long Lian Stella X. Yu

Zusammenfassung

Gegeben sei ein nicht gekennzeichnetes Datenset und ein Budget für Annotationen. Wir untersuchen, wie man eine feste Anzahl von Instanzen selektiv kennzeichnen kann, sodass das semi-überwachte Lernen (SSL) auf einem solchen teilweise gekennzeichneten Datenset am effektivsten ist. Neben der üblichen Propagation von Kennzeichnungen vom gekennzeichneten zu den restlichen nicht gekennzeichneten Daten konzentrieren wir uns auf die Auswahl der richtigen Daten zum Kennzeichnen. Diese Aufgabe der Instanzselektion ist herausfordernd, da wir ohne irgendeine gekennzeichnete Daten nicht wissen, welches das Lernziel sein sollte. Intuitiv müssen die zu kennzeichnenden Instanzen repräsentativ und vielfältig sein, unabhängig davon, um welche Downstream-Aufgabe es sich handelt: Die Ersteren würden die Propagation von Kennzeichnungen zu den nicht gekennzeichneten Daten erleichtern, während Letztere eine Abdeckung des gesamten Datensets sicherstellen würden. Dieses Konzept erfassen wir durch die Auswahl von Clustervorlagen, entweder in einem vortrainierten Merkmalsraum oder zusammen mit der Merkmalsoptimierung, beides ohne Kennzeichnungen. Unser unsupervises selektives Kennzeichnen verbessert SSL-Methoden im Vergleich zu dem aktuell besten aktiven Lernen bei gegebenen gekennzeichneten Daten um 8 bis 25 Mal in Bezug auf die Effizienz der Kennzeichnung. Zum Beispiel steigert es die Genauigkeit von FixMatch um 10% (14%) bei 0,08% (0,2%) gekennzeichnetem Daten auf CIFAR-10 (ImageNet-1K), was zeigt, dass eine geringe Berechnungszeit für die Auswahl der zu kennzeichnenden Daten erhebliche Vorteile bringt, insbesondere bei einem niedrigen Annotationbudget. Unsere Arbeit legt einen neuen Standard für praktisches und effizientes SSL fest.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp