Code vestimentaire : Essai virtuel multi-catégories à haute résolution

La tentative virtuelle basée sur l’image vise à transférer l’apparence d’un article de mode sur l’image d’une personne cible. Les travaux antérieurs se concentrent principalement sur les vêtements pour le haut du corps (tels que les t-shirts, chemises ou hauts) et négligent les articles pour le corps entier ou pour la partie inférieure du corps. Cette limitation découle principalement d’un facteur : les jeux de données publiques actuellement disponibles pour la tentative virtuelle basée sur l’image ne prennent pas en compte cette diversité, limitant ainsi les progrès dans ce domaine. Pour pallier cette lacune, nous introduisons Dress Code, un jeu de données comprenant des images de vêtements appartenant à plusieurs catégories. Dress Code est plus de trois fois plus volumineux que les jeux de données publiques existants pour la tentative virtuelle basée sur l’image, et propose des images appariées de haute résolution (1024×768) avec des modèles de référence en vue frontale et en corps entier. Afin de générer des images de tentative virtuelle en haute définition, offrant une qualité visuelle élevée et une richesse détaillée, nous proposons d’apprendre des caractéristiques discriminantes fines. Plus précisément, nous utilisons un discriminateur conscient du sens, qui effectue des prédictions au niveau pixel plutôt qu’au niveau image ou patch. Une évaluation expérimentale étendue démontre que l’approche proposée surpasser les méthodes de référence ainsi que les concurrentes de l’état de l’art en termes de qualité visuelle et de résultats quantitatifs. Le jeu de données Dress Code est disponible publiquement à l’adresse suivante : https://github.com/aimagelab/dress-code.