HyperAIHyperAI
il y a 17 jours

MoPro : Apprentissage supervisé par web à l’aide de prototypes à momentum

Junnan Li, Caiming Xiong, Steven C.H. Hoi
MoPro : Apprentissage supervisé par web à l’aide de prototypes à momentum
Résumé

Nous proposons une méthode d’apprentissage de représentations supervisée par le web, qui n’est pas soumise à l’inscalabilité des annotations dans l’apprentissage supervisé, ni à l’inscalabilité computationnelle de l’apprentissage auto-supervisé. La plupart des travaux existants sur l’apprentissage de représentations webly-supervisé reposent sur une approche supervisée classique, sans tenir compte du bruit omniprésent dans les données d’entraînement, tandis que la plupart des méthodes antérieures pour l’apprentissage en présence de bruit d’étiquettes se révèlent moins efficaces sur des données bruyantes à grande échelle du monde réel. Nous proposons MoPro (Momentum Prototypes), une méthode simple d’apprentissage contrastif capable de corriger en ligne les étiquettes erronées, d’éliminer les échantillons hors distribution et d’apprendre des représentations. MoPro atteint des performances de pointe sur WebVision, un jeu de données faiblement étiqueté et bruyant. De plus, MoPro montre une supériorité significative lorsqu’un modèle préentraîné est transféré à des tâches de classification et de détection d’images. Il dépasse le modèle préentraîné sur ImageNet avec supervision de +10,5 sur la classification à 1-shot sur VOC, et surpasse le meilleur modèle préentraîné auto-supervisé de +17,3 lors d’un finetuning sur seulement 1 % des échantillons étiquetés de ImageNet. En outre, MoPro s’avère plus robuste aux décalages de distribution. Le code source et les modèles préentraînés sont disponibles à l’adresse suivante : https://github.com/salesforce/MoPro.