HyperAIHyperAI
vor 17 Tagen

Robuste und zerlegbare durchschnittliche Präzision für die Bildretrieval

Elias Ramzi, Nicolas Thome, Clément Rambour, Nicolas Audebert, Xavier Bitot
Robuste und zerlegbare durchschnittliche Präzision für die Bildretrieval
Abstract

Bei der Bildretrieval-Evaluation basieren herkömmliche Metriken auf der Rangordnung der Scores, beispielsweise auf dem durchschnittlichen Präzisionswert (Average Precision, AP). In diesem Paper stellen wir eine Methode namens robust and decomposable average precision (ROADMAP) vor, die zwei zentrale Herausforderungen bei der end-to-end-Training tiefer neuronalen Netze mit AP adressiert: Nicht-Differenzierbarkeit und Nicht-Zerlegbarkeit. Erstens schlagen wir eine neue differenzierbare Approximation der Rangfunktion vor, die eine obere Schranke des AP-Verlustes liefert und ein robustes Training gewährleistet. Zweitens entwerfen wir eine einfache, jedoch effektive Verlustfunktion, um die Zerlegbarkeitslücke zwischen dem AP-Wert im gesamten Trainingsdatensatz und seiner durchschnittlichen Batch-Näherung zu verringern, wobei wir theoretische Garantien hierfür liefern. Umfassende Experimente an drei Bildretrieval-Datensätzen zeigen, dass ROADMAP mehrere neuere AP-Näherungsmethoden übertrifft und die Bedeutung unserer beiden Beiträge unterstreicht. Schließlich erzielt die Verwendung von ROADMAP beim Training tiefer Modelle hervorragende Leistungen, die die bisher besten Ergebnisse auf den drei Datensätzen übertreffen.