Klassifizierung ist eine starke Grundlinie für tiefes Metriklernen

Tiefes Metrik-Lernen strebt an, eine Funktion zu erlernen, die Bildpixel auf Einbettungsmerkmalsvektoren abbildet, die die Ähnlichkeit zwischen Bildern modellieren. Zwei Hauptanwendungen des Metrik-Lernens sind die inhaltsbasierte Bildsuche und die Gesichtsverifizierung. Bei Suchaufgaben basieren die meisten aktuellen Stand-der-Technik-(SOTA)-Ansätze auf der nichtparametrischen Tripletten-Trainingsmethode. Für Gesichtsverifizierungs-Aufgaben haben jedoch jüngste SOTA-Ansätze den parametrischen Klassifikationsansatz übernommen. In dieser Arbeit untersuchen wir die Effektivität von klassifikationsbasierten Ansätzen auf Bilddatensätzen für Suchvorgänge. Wir evaluieren unsere Methode an mehreren standardisierten Suchdatensätzen wie CAR-196, CUB-200-2011, Stanford Online Product und In-Shop-Datensätzen für Bildsuche und Clustering und zeigen, dass unser klassifikationsbasierter Ansatz in verschiedenen Merkmalsdimensionen und Basis-Merkmalsnetzwerken wettbewerbsfähig ist. Darüber hinaus geben wir Einblicke in die Leistungsbeeinflussung durch das Unterstichprobenziehen von Klassen für skalierbare klassifikationsbasierte Trainingsmethoden sowie in die Auswirkungen der Binarisierung, die effizientes Speichern und Berechnen für praktische Anwendungen ermöglicht.