HyperAIHyperAI

Command Palette

Search for a command to run...

Unüberwachtes Lernen von Objektlandmarken durch faktorisierte räumliche Einbettungen

James Thewlis Hakan Bilen Andrea Vedaldi

Zusammenfassung

Das automatische Lernen der Struktur von Objektkategorien bleibt ein wichtiges offenes Problem in der Computer Vision. In dieser Arbeit schlagen wir einen neuen unüberwachten Ansatz vor, der es ermöglicht, Landmarken in Objektkategorien zu entdecken und zu lernen, um ihre Struktur zu charakterisieren. Unser Ansatz basiert auf der Faktorisierung von Bildverformungen, die durch eine Veränderung des Betrachtungswinkels oder eine Verformung des Objekts verursacht werden, indem wir ein tiefes neuronales Netzwerk trainieren, das Landmarken konsistent mit diesen visuellen Effekten erkennt. Darüber hinaus zeigen wir, dass die gelernten Landmarken sinnvolle Korrespondenzen zwischen verschiedenen Objektinstanzen innerhalb einer Kategorie herstellen können, ohne dass diese Anforderung explizit gestellt werden muss. Wir bewerten die Methode qualitativ anhand verschiedener Objekttypen, sowohl natürlicher als auch künstlicher Herkunft. Zudem demonstrieren wir, dass unsere unüberwachten Landmarken hoch prädiktiv für manuell annotierte Landmarken in Gesichtsbenchmark-Datensätzen sind und zur Regression dieser mit hoher Genauigkeit verwendet werden können.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp