ProxyNCA++: Neubewertung und Erneuerung der Proxy Neighborhood Component Analysis

Wir betrachten das Problem des Distance-Metric-Lernens (DML), bei dem es darum geht, eine effektive Ähnlichkeitsmaß zwischen Bildern zu erlernen. Wir überprüfen erneut ProxyNCA und integrieren mehrere Verbesserungen. Wir stellen fest, dass eine niedrige Temperaturskalierung ein leistungsentscheidender Bestandteil ist, und erklären, warum sie funktioniert. Zusätzlich entdecken wir, dass Global Max Pooling im Allgemeinen eine bessere Leistung erzielt als Global Average Pooling. Außerdem löst unser vorgeschlagener schneller beweglicher Proxy das Problem kleiner Gradienten bei Proxies, wobei dieser Bestandteil gut mit der niedrigen Temperaturskalierung und dem Global Max Pooling synergistisch zusammenwirkt. Unser verbessertes Modell, ProxyNCA++, erreicht im Vergleich zum ursprünglichen ProxyNCA-Algorithmus eine durchschnittliche Verbesserung des Recall@1 um 22,9 Prozentpunkte über vier verschiedene Zero-Shot-Abfrage-Datensätze hinweg. Darüber hinaus erzielen wir state-of-the-art-Ergebnisse auf den Datensätzen CUB200, Cars196, Sop und InShop mit Recall@1-Werten von jeweils 72,2, 90,1, 81,4 und 90,9.