HyperAIHyperAI
il y a 2 mois

En Défense du Pseudo-Étiquetage : Un Cadre de Sélection de Pseudo-Étiquettes Prenant en Compte l'Incertitude pour l'Apprentissage Semi-Supervisé

Mamshad Nayeem Rizve; Kevin Duarte; Yogesh S Rawat; Mubarak Shah
En Défense du Pseudo-Étiquetage : Un Cadre de Sélection de Pseudo-Étiquettes Prenant en Compte l'Incertitude pour l'Apprentissage Semi-Supervisé
Résumé

La recherche récente en apprentissage semi-supervisé (SSL) est principalement dominée par les méthodes basées sur la régularisation de cohérence, qui obtiennent de bonnes performances. Cependant, ces méthodes dépendent fortement des augmentations de données spécifiques au domaine, ce qui n'est pas facile à réaliser pour toutes les modalités de données. Le pseudo-étiquetage (PL) est une approche générale d'SSL qui n'a pas cette contrainte mais dont les performances sont relativement médiocres dans sa formulation originale. Nous soutenons que le PL sous-performe en raison des prédictions à forte confiance erronées issues de modèles mal calibrés ; ces prédictions génèrent de nombreux faux pseudo-étiquettes, entraînant un entraînement bruyant. Nous proposons un cadre de sélection de pseudo-étiquettes prenant en compte l'incertitude (UPS), qui améliore la précision du pseudo-étiquetage en réduisant considérablement le niveau de bruit rencontré lors du processus d'entraînement. De plus, UPS généralise le processus de pseudo-étiquetage, permettant la création d'étiquettes négatives ; ces étiquettes négatives peuvent être utilisées pour la classification multi-étiquettes ainsi que pour l'apprentissage négatif afin d'améliorer la classification mono-étiquette. Nous obtenons des performances solides lorsque nous comparons notre méthode aux méthodes SSL récentes sur les jeux de données CIFAR-10 et CIFAR-100. En outre, nous démontrons la polyvalence de notre méthode sur le jeu de données vidéo UCF-101 et le jeu de données multi-étiquettes Pascal VOC.