Apprentissage contrastif supervisé sur des images mélangées pour la reconnaissance en queue longue

Les données du monde réel présentent souvent une distribution à queue longue, où le nombre d’échantillons par classe n’est pas équitablement réparti parmi les classes d’apprentissage. Ces données déséquilibrées forment un espace de caractéristiques biaisé, ce qui détériore les performances du modèle de reconnaissance. Dans cet article, nous proposons une nouvelle méthode de reconnaissance à queue longue visant à équilibrer l’espace de caractéristiques latentes. Tout d’abord, nous introduisons une technique d’augmentation de données basée sur MixUp afin de réduire le biais inhérent aux données à queue longue. Ensuite, nous proposons une nouvelle méthode d’apprentissage contrastif supervisé, nommée Supervised Contrastive Learning on Mixed Classes (SMC), dédiée aux images combinées. SMC génère un ensemble de positives à partir des étiquettes de classe des images originales. Le ratio de combinaison des positives pondère les termes positifs dans la fonction de perte d’entraînement. L’approche SMC, couplée à une fonction de perte basée sur la combinaison de classes, explore un espace de données plus diversifié, améliorant ainsi la capacité de généralisation du modèle. Des expériences étendues sur diverses benchmarks démontrent l’efficacité de notre méthode d’entraînement en une seule phase.