HyperAIHyperAI
il y a 2 mois

Multimodal Quasi-AutoRégression : Prévision de la popularité visuelle des nouveaux produits de mode

Stefanos I. Papadopoulos; Christos Koutlis; Symeon Papadopoulos; Ioannis Kompatsiaris
Multimodal Quasi-AutoRégression : Prévision de la popularité visuelle des nouveaux produits de mode
Résumé

L'estimation des préférences des consommateurs est d'une importance capitale pour l'industrie de la mode, car une utilisation appropriée de cette information peut être bénéfique en termes de profit. La détection des tendances dans la mode est une tâche complexe en raison du rythme rapide des changements dans l'industrie. De plus, prédire la popularité visuelle de nouveaux designs de vêtements est encore plus exigeant en raison du manque de données historiques. À cet effet, nous proposons MuQAR, une architecture de deep learning multimodale quasi-auto-régressive qui combine deux modules : (1) un perceptron multi-couche multi-modal traitant les caractéristiques catégorielles, visuelles et textuelles du produit et (2) un réseau neuronal quasi-auto-régressif modélisant la série temporelle « cible » des attributs du produit ainsi que la série temporelle « exogène » de tous les autres attributs. Nous utilisons la vision par ordinateur, la classification d'images et le légendage d'images pour extraire automatiquement les caractéristiques visuelles et les descriptions textuelles à partir des images de nouveaux produits. Le design des produits en mode est initialement exprimé visuellement, et ces caractéristiques représentent les particularités uniques des produits sans interférer avec le processus créatif de leurs concepteurs en nécessitant des entrées supplémentaires (par exemple, des textes écrits manuellement). Nous employons la série temporelle des attributs cibles du produit comme indicateur des schémas de popularité temporelle, atténuant ainsi le manque de données historiques, tandis que les séries temporelles exogènes aident à capturer les tendances parmi les attributs interconnectés. Nous effectuons une analyse exhaustive par élimination sur deux grands ensembles de données d'images de mode, Mallzee et SHIFT15m, pour évaluer l'adéquation de MuQAR, et nous utilisons également le jeu de données Amazon Reviews: Home and Kitchen pour évaluer sa généralisabilité à d'autres domaines. Une étude comparative sur le jeu de données VISUELLE montre que MuQAR est capable de rivaliser et même surpasser l'état actuel de l'art dans ce domaine avec une amélioration respective de 4,65 % et 4,8 % en termes d'WAPE (Weighted Absolute Percentage Error) et d'MAE (Mean Absolute Error).

Multimodal Quasi-AutoRégression : Prévision de la popularité visuelle des nouveaux produits de mode | Articles de recherche récents | HyperAI