HyperAIHyperAI

Command Palette

Search for a command to run...

Feinabstimmung der CNN-Bildsuche ohne menschliche Annotation

Filip Radenović Giorgos Tolias Ondřej Chum

Zusammenfassung

BildDeskriptoren, die auf den Aktivierungen von Faltungsneuronalen Netzen (CNNs) basieren, haben sich aufgrund ihrer diskriminativen Leistungsfähigkeit, der Kompaktheit der Darstellung und der Sucheffizienz im Bildretrieval durchgesetzt. Das Training von CNNs, sei es vom Grundmodell aus oder durch Feinabstimmung, erfordert eine große Menge an annotierten Daten, wobei oft eine hohe Qualität der Annotation entscheidend ist. In dieser Arbeit schlagen wir vor, CNNs für das Bildretrieval vollautomatisch an einer großen Sammlung ungeordneter Bilder zu feinjustieren. Rekonstruierte 3D-Modelle, die durch fortschrittliche Methoden des Retrievals und der Struktur aus Bewegung (Structure from Motion) erhalten werden, leiten die Auswahl der Trainingsdaten. Wir zeigen, dass sowohl schwierige positive als auch schwierige negative Beispiele, die durch Ausnutzung der Geometrie und der Kameraspositionen aus den 3D-Modellen gewählt werden, die Leistungsfähigkeit des speziellen Objekt-Retrievals verbessern. Die diskriminativ gelernte Weißen (Whitening) des CNN-Deskriptors aus denselben Trainingsdaten übertrifft die häufig verwendete PCA-Weißen. Wir schlagen ein neues trainierbares Generalisierte-Mittelwert (GeM)-Pooling-Layer vor, das Maximum- und Durchschnittspooling verallgemeinert und zeigen, dass es die Leistung des Retrievals steigert. Die Anwendung der vorgeschlagenen Methode auf das VGG-Netzwerk erreicht den aktuellen Stand der Technik auf den Standard-Benchmarks: Oxford Buildings-, Paris- und Holidays-Datensätzen.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Feinabstimmung der CNN-Bildsuche ohne menschliche Annotation | Paper | HyperAI