HyperAIHyperAI

Command Palette

Search for a command to run...

Aggregation von tiefen Faltungsmerkmalen für die Bildsuche

Artem Babenko Victor Lempitsky

Zusammenfassung

Mehrere kürzliche Arbeiten haben gezeigt, dass BildDeskriptoren, die von tiefen Faltungsneuronalen Netzen erzeugt werden, den aktuellen Stand der Technik in Bezug auf die Klassifizierung und das Abrufen von Bildern bieten. Es wurde auch gezeigt, dass die Aktivierungen aus den Faltungsschichten als lokale Merkmale interpretiert werden können, die bestimmte Bildregionen beschreiben. Diese lokalen Merkmale können mithilfe von für lokale Merkmale entwickelten Aggregationsansätzen (z.B. Fisher-Vektoren) zusammengefasst werden, wodurch neue leistungsstarke globale Deskriptoren entstehen.In dieser Arbeit untersuchen wir mögliche Wege zur Aggregation lokaler tiefer Merkmale, um kompakte globale Deskriptoren für die Bildsuche zu erzeugen. Zunächst zeigen wir, dass tiefe Merkmale und traditionelle manuell gestaltete Merkmale sehr unterschiedliche Verteilungen paarweiser Ähnlichkeiten aufweisen, sodass bestehende Aggregationsmethoden sorgfältig neu evaluiert werden müssen. Eine solche Neu-Evaluierung ergibt, dass im Gegensatz zu flachen Merkmalen eine einfache Aggregationsmethode basierend auf Summen-Pooling wahrscheinlich die beste Leistung für tiefe Faltungsmerkmale bietet. Diese Methode ist effizient, hat wenige Parameter und birgt bei der Lernphase z.B. des PCA-Matrix nur geringes Überanpassungsrisiko. Insgesamt verbessert der neue kompakte globale Deskriptor den aktuellen Stand der Technik auf vier üblichen Benchmarks erheblich.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Aggregation von tiefen Faltungsmerkmalen für die Bildsuche | Paper | HyperAI