HyperAIHyperAI
il y a 2 mois

Vers un apprentissage semi-supervisé réaliste

Mamshad Nayeem Rizve; Navid Kardan; Mubarak Shah
Vers un apprentissage semi-supervisé réaliste
Résumé

L'apprentissage profond est en train de repousser les limites de l'état de l'art dans de nombreuses applications de la vision par ordinateur. Cependant, il repose sur des dépôts de données annotées de grande taille, et la capture de la nature non contrainte des données du monde réel reste un défi à relever. L'apprentissage semi-supervisé (SSL) complète les données d'entraînement annotées avec un corpus important de données non étiquetées pour réduire le coût d'annotation. L'approche SSL standard suppose que les données non étiquetées proviennent de la même distribution que les données annotées. Récemment, un problème SSL plus réaliste, appelé SSL en monde ouvert, a été introduit, où les données non annotées peuvent contenir des échantillons appartenant à des classes inconnues. Dans cet article, nous proposons une nouvelle approche basée sur les pseudo-étiquettes pour aborder le SSL dans un cadre en monde ouvert. Au cœur de notre méthode, nous utilisons l'incertitude des échantillons et intégrons des connaissances a priori sur la distribution des classes pour générer des pseudo-étiquettes fiables et sensibles à la distribution des classes pour les données non étiquetées appartenant à des classes connues et inconnues. Nos expérimentations approfondies mettent en lumière l'efficacité de notre approche sur plusieurs jeux de données de référence, où elle surpass substantiellement l'état actuel de l'art sur sept jeux de données variés, notamment CIFAR-100 (~17 %), ImageNet-100 (~5 %) et Tiny ImageNet (~9 %). Nous soulignons également la flexibilité de notre approche pour résoudre la tâche de découverte de nouvelles classes, démontrons sa stabilité dans le traitement des données déséquilibrées et complétons notre méthode avec une technique pour estimer le nombre de nouvelles classes.

Vers un apprentissage semi-supervisé réaliste | Articles de recherche récents | HyperAI