Récupération d'images similaires en e-commerce à l'aide de l'apprentissage profond

Dans cet article, nous proposons un réseau neuronal convolutif profond pour l'apprentissage des plongements d'images afin de capturer la notion de similarité visuelle. Nous présentons une architecture jumelle profonde qui, lorsqu'elle est entraînée sur des paires d'images positives et négatives, apprend un plongement qui approxime avec précision le classement des images en fonction de la notion de similarité visuelle. Nous avons également mis en œuvre une nouvelle méthode de calcul de la perte utilisant une métrique de perte angulaire basée sur les exigences du problème. Le plongement final de l'image est une représentation combinée des plongements de bas et haut niveau. Nous avons utilisé une matrice de distance fractionnelle pour calculer la distance entre les plongements appris dans l'espace à n dimensions. Enfin, nous comparons notre architecture avec d'autres architectures profondes existantes et démontrons la supériorité de notre solution en termes de recherche d'images en testant l'architecture sur quatre jeux de données. Nous montrons également comment notre réseau suggéré est meilleur que les autres CNNs traditionnels profonds utilisés pour capturer des similarités d'images fines en apprenant un plongement optimal.