HyperAIHyperAI
il y a 17 jours

Apprentissage contrastif supervisé pour l'appariement de produits

Ralph Peeters, Christian Bizer
Apprentissage contrastif supervisé pour l'appariement de produits
Résumé

L’apprentissage contrastif a permis de faire progresser l’état de l’art de nombreuses tâches en vision par ordinateur et en récupération d’information au cours des dernières années. Ce poster présente le premier travail qui applique l’apprentissage contrastif supervisé à la tâche de correspondance de produits dans le commerce électronique, en utilisant des offres de produits provenant de différents e-marchands. Plus précisément, nous utilisons une technique d’apprentissage contrastif supervisé pour pré-entraîner un encodeur Transformer, qui est ensuite affiné pour la tâche de correspondance à l’aide de données d’entraînement par paires. Nous proposons également une stratégie d’échantillonnage consciente de la source, permettant d’appliquer l’apprentissage contrastif dans des cas d’utilisation où les données d’entraînement ne contiennent pas d’identifiants de produits. Nous démontrons qu’appliquer un pré-entraînement contrastif supervisé combiné à une stratégie d’échantillonnage consciente de la source améliore significativement les performances par rapport à l’état de l’art sur plusieurs benchmarks largement utilisés : pour Abt-Buy, nous atteignons un score F1 de 94,29 (+3,24 par rapport à l’état de l’art précédent), pour Amazon-Google un score de 79,28 (+3,7). Pour les jeux de données WDC Computers, les améliorations du score F1 varient entre +0,8 et +8,84 selon la taille de l’ensemble d’entraînement. Des expériences supplémentaires avec une augmentation de données et un pré-entraînement contrastif auto-supervisé montrent que l’augmentation de données peut être bénéfique pour les ensembles d’entraînement plus petits, tandis que le pré-entraînement auto-supervisé entraîne une dégradation significative des performances en raison du bruit intrinsèque dans les étiquettes. Nous concluons donc que le pré-entraînement contrastif présente un fort potentiel pour les cas d’utilisation de correspondance de produits lorsque de l’information de supervision explicite est disponible.

Apprentissage contrastif supervisé pour l'appariement de produits | Articles de recherche récents | HyperAI