HyperAIHyperAI
vor 2 Monaten

Unüberwachtes Lernen von Objektlandmarken durch faktorisierte räumliche Einbettungen

James Thewlis; Hakan Bilen; Andrea Vedaldi
Unüberwachtes Lernen von Objektlandmarken durch faktorisierte räumliche Einbettungen
Abstract

Das automatische Lernen der Struktur von Objektkategorien bleibt ein wichtiges offenes Problem in der Computer Vision. In dieser Arbeit schlagen wir einen neuen unüberwachten Ansatz vor, der es ermöglicht, Landmarken in Objektkategorien zu entdecken und zu lernen, um ihre Struktur zu charakterisieren. Unser Ansatz basiert auf der Faktorisierung von Bildverformungen, die durch eine Veränderung des Betrachtungswinkels oder eine Verformung des Objekts verursacht werden, indem wir ein tiefes neuronales Netzwerk trainieren, das Landmarken konsistent mit diesen visuellen Effekten erkennt. Darüber hinaus zeigen wir, dass die gelernten Landmarken sinnvolle Korrespondenzen zwischen verschiedenen Objektinstanzen innerhalb einer Kategorie herstellen können, ohne dass diese Anforderung explizit gestellt werden muss. Wir bewerten die Methode qualitativ anhand verschiedener Objekttypen, sowohl natürlicher als auch künstlicher Herkunft. Zudem demonstrieren wir, dass unsere unüberwachten Landmarken hoch prädiktiv für manuell annotierte Landmarken in Gesichtsbenchmark-Datensätzen sind und zur Regression dieser mit hoher Genauigkeit verwendet werden können.

Unüberwachtes Lernen von Objektlandmarken durch faktorisierte räumliche Einbettungen | Neueste Forschungsarbeiten | HyperAI