Entkopplung verbessert schwach überwachte lokale Merkmale

Schwach überwachtes Lernen kann helfen, Methoden für lokale Merkmale bei der Überwindung des Hindernisses einer umfangreichen Datenmenge mit dicht beschrifteten Korrespondenzen zu unterstützen. Allerdings kann schwache Überwachung die Verluste, die durch die Schritte der Detektion und Beschreibung verursacht werden, nicht voneinander unterscheiden. Daher leidet das direkte Durchführen von schwach überwachtem Lernen in einem gemeinsamen Pipeline-Verfahren, das erst beschreibt und dann detektiert, an eingeschränkter Leistung. In diesem Artikel schlagen wir eine getrennte Pipeline vor, die erst beschreibt und dann detektiert und speziell für schwach überwachtes Lernen von lokalen Merkmalen entwickelt wurde. Innerhalb unserer Pipeline wird der Detektionsschritt vom Beschreibungsschritt getrennt und verschoben, bis diskriminierende und robuste Deskriptoren gelernt wurden. Darüber hinaus führen wir eine Suchstrategie von Linie zu Fenster ein, um die Informationen zur Kameraposition explizit für besseres Deskriptorlernen zu nutzen. Ausführliche Experimente zeigen, dass unsere Methode, genannt PoSFeat (Camera Pose Supervised Feature), sowohl frühere vollständig als auch schwach überwachte Methoden übertreffen und den aktuellen Stand der Technik auf einer Vielzahl von nachgelagerten Aufgaben erreicht.