VITON-HD : Essai virtuel à haute résolution par normalisation consciente des désalignements

La tâche de l’essayage virtuel basé sur des images vise à transférer un vêtement cible vers la région correspondante d’une personne, une opération généralement abordée en ajustant l’article à la partie du corps souhaitée et en fusionnant le vêtement déformé avec l’image de la personne. Bien que de nombreuses études aient été menées récemment, la résolution des images synthétisées reste limitée à des niveaux faibles (par exemple, 256x192), constituant ainsi une limitation majeure empêchant de satisfaire pleinement les consommateurs en ligne. Nous soutenons que cette limitation provient de plusieurs défis : à mesure que la résolution augmente, les artefacts présents dans les zones mal alignées entre le vêtement déformé et la région cible deviennent visibles dans les résultats finaux ; d’autre part, les architectures utilisées dans les méthodes existantes présentent une faible capacité à générer des parties du corps de haute qualité tout en préservant la netteté des textures des vêtements. Pour relever ces défis, nous proposons une nouvelle méthode d’essayage virtuel, appelée VITON-HD, capable de synthétiser des images d’essayage virtuel à haute résolution de 1024x768. Plus précisément, nous commençons par préparer une carte de segmentation afin de guider la synthèse, puis nous ajustons grossièrement le vêtement cible sur le corps d’une personne donnée. Ensuite, nous introduisons une normalisation ALIgnment-Aware Segment (ALIAS) et un générateur ALIAS afin de gérer efficacement les zones mal alignées et de préserver les détails des entrées à haute résolution (1024x768). Grâce à une évaluation rigoureuse par rapport aux méthodes existantes, nous démontrons que VITON-HD surpassent significativement les méthodes de référence tant sur le plan qualitatif que quantitatif en termes de qualité des images synthétisées. Le code source est disponible à l’adresse suivante : https://github.com/shadow2496/VITON-HD.