HyperAIHyperAI
il y a 17 jours

EPYNET : Réseau pyramidal efficace pour la segmentation des vêtements

{Heitor Silvério Lopes, Andrei De Souza Inácio}
Résumé

Les traits biométriques doux extraits du corps humain, tels que le type de vêtements, la couleur des cheveux ou les accessoires, constituent des informations utiles pour le suivi et l’identification des individus. La segmentation sémantique de ces traits à partir d’images reste un défi pour les chercheurs en raison de la grande variété des styles vestimentaires, des superpositions, des formes et des couleurs. Pour relever ces défis, nous proposons EPYNET, un cadre pour la segmentation des vêtements. EPYNET repose sur le détecteur Single Shot MultiBox (SSD) et le réseau de pyramide de caractéristiques (FPN), avec le modèle EfficientNet comme architecture principale (backbone). Le cadre intègre également des méthodes d’augmentation de données et des techniques de réduction du bruit afin d’améliorer la précision de la segmentation. Nous proposons également un nouveau jeu de données baptisé UTFPR-SBD3, composé de 4 500 images annotées manuellement en 18 catégories d’objets, plus la classe de fond. Contrairement aux jeux de données publics existants, souvent caractérisés par une distribution déséquilibrée des classes, UTFPR-SBD3 dispose d’au moins 100 instances par classe, ce qui permet de réduire la difficulté d’entraînement des modèles d’apprentissage profond. Nous introduisons une nouvelle mesure d’imbalancedness des données, motivée par la difficulté à comparer différents jeux de données pour la segmentation des vêtements. Grâce à cette mesure, il devient possible d’identifier l’impact du fond, des classes comprenant des objets de petite taille, ou encore des classes trop peu ou trop abondamment représentées. Les résultats expérimentaux sur UTFPR-SBD3 démontrent l’efficacité d’EPYNET, qui surpasse les méthodes de pointe pour la segmentation des vêtements sur les jeux de données publics. Sur la base de ces résultats, nous estimons que l’approche proposée pourrait s’avérer particulièrement utile dans de nombreuses applications réelles liées aux biométriques douces, à la surveillance des personnes, à la description d’images, à la recommandation de vêtements, et à d’autres domaines connexes.