Smooth-AP: Glättung des Weges zur großmaßstäblichen Bildsuche

Die Optimierung eines rangbasierten Metriks, wie der durchschnittlichen Genauigkeit (Average Precision, AP), ist aufgrund seiner Nicht-Differenzierbarkeit notorisch schwierig und kann daher nicht direkt mit Gradientenabstiegsverfahren optimiert werden. Um dieses Problem zu lösen, führen wir ein Ziel ein, das stattdessen eine geglättete Approximation von AP optimiert, die als Smooth-AP bezeichnet wird. Smooth-AP ist eine flexibel einsetzbare Zielfunktion, die es ermöglicht, tiefere Netzwerke von Anfang bis Ende zu trainieren, wobei sie eine einfache und elegante Implementierung bietet. Wir präsentieren auch eine Analyse, warum die direkte Optimierung der rangbasierten Metrik AP gegenüber anderen Verlustfunktionen des tiefen Metriklearnings Vorteile bietet. Wir wenden Smooth-AP auf Standard-Retrieval-Benchmarks an: Stanford Online Products und VehicleID, und evaluieren sie auch auf größeren Datensätzen: INaturalist für feingranulare Kategorien-Retrieval sowie VGGFace2 und IJB-C für Gesichtserkennung. In allen Fällen verbessern wir die Leistung im Vergleich zum Stand der Technik, insbesondere bei größeren Datensätzen, was die Effektivität und Skalierbarkeit von Smooth-AP in realen Szenarien unterstreicht.