Diff-SySC : Une Approche Utilisant des Modèles de Diffusion pour la Classification d'Images en Mode Semi-supervisé

Les modèles de diffusion ont révolutionné le domaine de l'apprentissage automatique génératif grâce à leur efficacité dans la modélisation de distributions de données complexes et multimodales. L'apprentissage semi-supervisé constitue une approche permettant d'extraire des informations à partir d'un grand corpus de données non étiquetées, sous l'hypothèse qu'une petite partie des données est étiquetée. Bien que de nombreuses méthodes génératives aient été précédemment appliquées aux tâches d'apprentissage semi-supervisé, très peu d'approches ont intégré des modèles de diffusion dans ce cadre. Dans ce travail, nous adaptons les modèles génératifs de diffusion les plus avancés au problème de classification d'images en contexte semi-supervisé. Nous proposons Diff-SySC, un nouveau pipeline d'apprentissage semi-supervisé basé sur l'étiquetage pseudo, qui utilise un modèle de diffusion pour apprendre la distribution de probabilité conditionnelle caractérisant le processus de génération des étiquettes. Les évaluations expérimentales mettent en évidence la robustesse de Diff-SySC sur des benchmarks de classification d'images, montrant qu'il surpassse les méthodes existantes sur CIFAR-10 et STL-10, tout en atteignant des performances compétitives sur CIFAR-100. Globalement, notre méthode dépasse les approches connexes dans 90,74 % des cas.