vor 8 Monaten

Zusammenfassung

Bei der visuellen Ortserkennung stellt die genaue Identifizierung und Zuordnung von Bildern von Orten unter variierenden Umweltbedingungen und Perspektiven weiterhin eine erhebliche Herausforderung dar. In dieser Arbeit stellen wir eine neue Technik vor, die Bag-of-Queries (BoQ) genannt wird. BoQ lernt eine Menge globaler Abfragen, die darauf ausgelegt sind, universelle ortsspezifische Merkmale zu erfassen. Im Gegensatz zu bestehenden Methoden, die Selbst-Aufmerksamkeit (Self-Attention) verwenden und die Abfragen direkt aus den Eingabe-Features generieren, verwendet BoQ separate lernfähige globale Abfragen, die durch Kreuz-Aufmerksamkeit (Cross-Attention) die Eingabe-Features abtasten, um konsistente Informationsaggregation sicherzustellen. Zudem bietet unsere Technik einen interpretierbaren Aufmerksamkeitsmechanismus und kann sowohl mit CNNs als auch mit Vision Transformer Backbones integriert werden. Die Leistungsfähigkeit von BoQ wird durch umfangreiche Experimente auf 14 großen Benchmarks demonstriert. Sie übertrifft konsistent aktuelle Stand der Technik-Methoden wie NetVLAD, MixVPR und EigenPlaces. Darüber hinaus übertreffen BoQ als globale Retrieval-Technik (einstufig) zweistufige Retrieval-Methoden wie Patch-NetVLAD, TransVPR und R2Former bei gleichzeitig deutlich höherer Geschwindigkeit und Effizienz um mehrere Größenordnungen. Der Code und die Modellgewichte sind öffentlich verfügbar unter https://github.com/amaralibey/Bag-of-Queries.

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 8 Monaten

Bilderkennung

Faltungsneuronales Netzwerk

Amar Ali-bey* Brahim Chaib-draa Philippe Giguère

Zusammenfassung

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 8 Monaten

Bilderkennung

Faltungsneuronales Netzwerk

Amar Ali-bey* Brahim Chaib-draa Philippe Giguère

Zusammenfassung

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

BoQ: Ein Ort ist einen Lernsack von Abfragen wert | Paper | HyperAI

Command Palette

BoQ: Ein Ort ist einen Lernsack von Abfragen wert

Amar Ali-bey* Brahim Chaib-draa Philippe Giguère

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

BoQ: Ein Ort ist einen Lernsack von Abfragen wert

Amar Ali-bey* Brahim Chaib-draa Philippe Giguère

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

BoQ: Ein Ort ist einen Lernsack von Abfragen wert

Amar Ali-bey* Brahim Chaib-draa Philippe Giguère

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters