Command Palette
Search for a command to run...
Tracer la bonne variété : Mélange de variétés pour l'apprentissage à partir de peu d'exemples
Tracer la bonne variété : Mélange de variétés pour l'apprentissage à partir de peu d'exemples
Puneet Mangla∗1,2 Mayank Singh∗1 Abhishek Sinha∗1 Nupur Kumari∗1 Vineeth N Balasubramanian2 Balaji Krishnamurthy1
Résumé
Les algorithmes d'apprentissage à faibles tirs (few-shot learning) visent à apprendre des paramètres de modèle capables de s'adapter à des classes inconnues avec l'aide de seulement quelques exemples étiquetés. Une technique de régularisation récente, le Manifold Mixup, se concentre sur l'apprentissage d'une représentation polyvalente, robuste aux petits changements dans la distribution des données. Étant donné que l'objectif de l'apprentissage à faibles tirs est étroitement lié à l'apprentissage de représentations robustes, nous étudions le Manifold Mixup dans ce contexte. L'apprentissage auto-supervisé est une autre technique qui apprend des caractéristiques sémantiquement significatives en utilisant uniquement la structure inhérente des données. Cette étude examine le rôle de l'apprentissage d'un espace de caractéristiques pertinent pour les tâches d'apprentissage à faibles tirs en utilisant des techniques d'auto-supervision et de régularisation. Nous constatons que la régularisation de l'espace de caractéristiques, enrichi par des techniques d'auto-supervision, avec le Manifold Mixup améliore considérablement les performances de l'apprentissage à faibles tirs. Nous montrons que notre méthode proposée, S2M2, dépasse la précision actuelle de pointe sur des jeux de données standards d'apprentissage à faibles tirs comme CIFAR-FS, CUB, mini-ImageNet et tiered-ImageNet de 3 à 8 %. À travers une série d'expériences approfondies, nous démontrons que les caractéristiques apprises grâce à notre approche généralisent bien aux tâches d'évaluation complexes d'apprentissage à faibles tirs, aux scénarios inter-domaines et sont robustes face à de légères modifications de la distribution des données.