HyperAIHyperAI
il y a 15 jours

MutexMatch : Apprentissage semi-supervisé avec régularisation de cohérence basée sur les mutex

Yue Duan, Zhen Zhao, Lei Qi, Lei Wang, Luping Zhou, Yinghuan Shi, Yang Gao
MutexMatch : Apprentissage semi-supervisé avec régularisation de cohérence basée sur les mutex
Résumé

Le problème central de l'apprentissage semi-supervisé (SSL) réside dans la manière d'exploiter efficacement les données non étiquetées. Pourtant, la plupart des méthodes existantes accordent une grande importance à l'utilisation des échantillons à haute confiance, tout en explorant peu le potentiel des échantillons à faible confiance. Dans cet article, nous proposons une nouvelle approche pour tirer parti des échantillons à faible confiance, basée sur une régularisation de cohérence fondée sur une contrainte mutuelle, nommée MutexMatch. Plus précisément, les échantillons à haute confiance doivent prédire de manière exacte « ce qu’ils sont » à l’aide d’un classificateur True-Positive classique, tandis que les échantillons à faible confiance sont utilisés pour atteindre un objectif plus simple : prédire facilement « ce qu’ils ne sont pas » via un classificateur True-Negative. Ainsi, non seulement nous réduisons les erreurs de pseudo-étiquetage, mais nous exploitons également pleinement les données non étiquetées à faible confiance grâce à la cohérence du degré de dissimilarité. MutexMatch obtient des performances supérieures sur plusieurs jeux de données standards, notamment CIFAR-10, CIFAR-100, SVHN, STL-10, mini-ImageNet et Tiny-ImageNet. Plus important encore, notre méthode excelle particulièrement lorsque le nombre de données étiquetées est faible : par exemple, une précision de 92,23 % avec seulement 20 données étiquetées sur CIFAR-10. Le code source et les poids du modèle sont disponibles à l’adresse suivante : https://github.com/NJUyued/MutexMatch4SSL.