HyperAIHyperAI
vor 2 Monaten

Verbesserte Einbettungen durch einfache positive Tripletten-Mining

Hong Xuan; Abby Stylianou; Robert Pless
Verbesserte Einbettungen durch einfache positive Tripletten-Mining
Abstract

Das Deep Metric Learning strebt danach, eine Einbettung zu definieren, bei der semantisch ähnliche Bilder in nahegelegene Positionen und semantisch unähnliche Bilder in ferne Positionen eingebettet werden. Viele Arbeiten haben sich auf Verlustfunktionen und Strategien konzentriert, um diese Einbettungen durch das Zusammenführen von Bildern derselben Klasse im Einbettungsraum so eng wie möglich zu lernen. In dieser Arbeit schlagen wir eine alternative, gelockerte Einbettungsstrategie vor, die nur verlangt, dass die Einbettungsfunktion jedes Trainingsbild auf die am ähnlichsten liegenden Beispiele derselben Klasse abbildet. Dieser Ansatz wird als "Easy Positive" Mining bezeichnet. Wir präsentieren eine Reihe von Experimenten und Visualisierungen, die zeigen, dass dieses "Easy Positive" Mining zu Einbettungen führt, die flexibler sind und sich besser auf neue, bisher nicht gesehene Daten verallgemeinern. Diese einfache Mining-Strategie erzielt ein Recall-Leistungsniveau, das den Stand der Technik übertreffen kann (einschließlich Ansätze mit komplizierten Verlustfunktionen und Ensemble-Methoden) auf Bildretrieval-Datensätzen wie CUB, Stanford Online Products, In-Shop Clothes und Hotels-50K.