HyperAIHyperAI
vor 17 Tagen

Lernen und Aggregieren tiefer lokaler Deskriptoren für die Instanz-Ebene Erkennung

Giorgos Tolias, Tomas Jenicek, Ondřej Chum
Lernen und Aggregieren tiefer lokaler Deskriptoren für die Instanz-Ebene Erkennung
Abstract

Wir schlagen eine effiziente Methode zur Lernung tiefer lokaler Deskriptoren für die Instanz-level-Erkennung vor. Der Trainingsprozess erfordert lediglich Beispiele aus positiven und negativen Bildpaaren und wird als Metrik-Learning von summiert gepoolten globalen Bild-Deskriptoren durchgeführt. Während der Inferenz werden die lokalen Deskriptoren durch die Aktivierungen interner Komponenten des Netzwerks bereitgestellt. Wir zeigen, warum ein solcher Ansatz lokale Deskriptoren erzeugt, die sich gut für die Schätzung von Bildähnlichkeit in Kombination mit klassischen effizienten Match-Kernmethoden eignen. Die experimentelle Validierung untersucht das Leistungs-Memory-Trade-off der aktuellen state-of-the-art-Bildsuchmethode basierend auf Match-Kernen. Im Vergleich zu bestehenden lokalen Deskriptoren erzielen die vorgeschlagenen Deskriptoren eine bessere Leistung bei zwei Aufgaben der Instanz-level-Erkennung und weisen gleichzeitig geringere Speicheranforderungen auf. Experimentell zeigen wir, dass globale Deskriptoren bei großem Skalen nicht ausreichend effektiv sind und dass lokale Deskriptoren entscheidend sind. Wir erreichen state-of-the-art-Leistung, wobei in einigen Fällen bereits ein so kleines Backbone-Netzwerk wie ResNet18 ausreicht.