HyperAIHyperAI
vor 2 Monaten

Verstehen der Bildretrieval-Neuordnung: Eine Perspektive der Graphen-Neuralnetze

Zhang, Xuanmeng ; Jiang, Minyue ; Zheng, Zhedong ; Tan, Xiao ; Ding, Errui ; Yang, Yi
Verstehen der Bildretrieval-Neuordnung: Eine Perspektive der Graphen-Neuralnetze
Abstract

Der Re-Ranking-Ansatz nutzt hochvertrauenswürdige abgerufene Stichproben, um die Suchergebnisse zu verfeinern, und wird häufig als Post-Processing-Werkzeug für Bildsuchaufgaben eingesetzt. Allerdings bemerken wir eine wesentliche Schwäche des Re-Rankings, nämlich die hohe rechnerische Komplexität, die in der Praxis zu unakzeptablen Zeitaufwendigkeiten für realweltliche Anwendungen führt. In dieser Arbeit untersuchen wir den Re-Ranking-Prozess neu und zeigen, dass er als Graph Neural Network (GNN)-Funktion mit hohem Parallelismus reformuliert werden kann. Insbesondere gliedern wir den konventionellen Re-Ranking-Prozess in zwei Phasen: das Abrufen hochwertiger Galerie-Stichproben und das Aktualisieren von Merkmalsvektoren. Wir argumentieren, dass die erste Phase dem Bau eines k-nächsten-Nachbarn-Graphen entspricht, während die zweite Phase als Verbreitung von Nachrichten innerhalb des Graphen angesehen werden kann. In der Praxis muss sich das GNN nur mit Knotenpunkten befassen, die durch verbundene Kanten miteinander verbunden sind. Da der Graph dünn besetzt ist, können wir die Knotenattribute effizient aktualisieren. Am Market-1501-Datensatz beschleunigen wir den Re-Ranking-Prozess von 89,2 Sekunden auf 9,4 Millisekunden mit einer K40m-GPU, was eine Echtzeit-Post-Verarbeitung ermöglicht. Ähnlich beobachten wir, dass unsere Methode auf den anderen vier Bildsuchbenchmarks – VeRi-776, Oxford-5k, Paris-6k und University-1652 – vergleichbare oder sogar bessere Suchergebnisse liefert und dabei nur geringe Zeitaufwendigkeit verursacht. Unser Code ist öffentlich verfügbar.

Verstehen der Bildretrieval-Neuordnung: Eine Perspektive der Graphen-Neuralnetze | Neueste Forschungsarbeiten | HyperAI