HyperAIHyperAI

Command Palette

Search for a command to run...

K-Means für unsupervised Instance-Segmentation unter Verwendung eines selbstüberwachten Transformers

Lee HongChul Lee MinYoung Park JaeEon Lim SeongTaek

Zusammenfassung

Instanzsegmentierung ist eine grundlegende Aufgabe im Bereich des maschinellen Sehens, bei der jedem Pixel eine entsprechende Klasse zugewiesen und Objekte in Achsenparallelen Rechtecken lokalisiert werden. Die Erhebung von pixelgenauen Segmentierungsannotierungen erweist sich jedoch als ressourcen- und zeitintensiver im Vergleich zur Erhebung von Klassifikations- oder Detektionslabels. In diesem Beitrag stellen wir einen neuartigen Ansatz vor, den iterativen Maskenverfeinerungsansatz mit einem selbstüberwachten Transformer (IMST), der klassenunabhängige, unsupervisierte Instanzsegmentierung mithilfe einfacher K-Means-Clustering-Verfahren und eines selbstüberwachten Vision-Transformers durchführt. IMST generiert sogenannte Pseudowahrheitslabels, die zur Trainings von kommerziell verfügbaren Instanzsegmentierungsmodellen genutzt werden können. Die Pseudolabels zeigen eine verbesserte Leistung auf mehreren Datensätzen. Das Instanzsegmentierungsmodell, das auf diesen Pseudolabels trainiert wurde, übertrifft state-of-the-art-Methoden für unsupervisierte Instanzsegmentierung auf COCO20k (+4,0 AP) und COCO val2017 (+2,6 AP), ohne Anpassungen am Trainingsverlust oder der Architektur. Wir zeigen zudem, dass unser Ansatz auf Aufgaben wie Einzel- oder Mehrfachobjekterkennung sowie supervisiertes Feintuning für Instanzsegmentierung erweitert werden kann, wobei er gegenüber früheren Methoden eine bessere Leistung erzielt.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
K-Means für unsupervised Instance-Segmentation unter Verwendung eines selbstüberwachten Transformers | Paper | HyperAI