HyperAIHyperAI
vor 2 Monaten

Verwendung von Deep Learning zur Abrufung ähnlicher E-Commerce-Bilder

Rishab Sharma; Anirudha Vishvakarma
Verwendung von Deep Learning zur Abrufung ähnlicher E-Commerce-Bilder
Abstract

In dieser Arbeit schlagen wir ein tiefes Faltungsneuronales Netzwerk (Convolutional Neural Network, CNN) vor, das zur Lern der Einbettungen von Bildern dient, um das Konzept der visuellen Ähnlichkeit zu erfassen. Wir stellen eine tiefe Siamesische Architektur vor, die bei der Ausbildung auf positiven und negativen Bildpaaren eine Einbettung lernt, die die Rangfolge der Bilder nach dem Konzept der visuellen Ähnlichkeit genauestens annähert. Darüber hinaus implementieren wir eine neuartige Verlustberechnungsmethode unter Verwendung eines Winkelsverlustmaßes (angular loss metrics), das den Anforderungen des Problems angepasst ist. Die endgültige Einbettung des Bildes ist eine kombinierte Darstellung der niedrig- und hochstufigen Einbettungen. Wir verwenden eine fraktionale Distanzmatrix, um den Abstand zwischen den gelernten Einbettungen im n-dimensionalen Raum zu berechnen. Schließlich vergleichen wir unsere Architektur mit anderen bestehenden tiefen Architekturen und demonstrieren die Überlegenheit unserer Lösung in Bezug auf die Bildretrieval durch Tests auf vier Datensätzen. Wir zeigen auch, wie unser vorgeschlagenes Netzwerk besser als andere traditionelle tiefe CNNs ist, die verwendet werden, um feingranulare Bildähnlichkeiten durch Lernen einer optimalen Einbettung zu erfassen.