Command Palette
Search for a command to run...
Réseaux prototypiques pour l'apprentissage peu supervisé
Réseaux prototypiques pour l'apprentissage peu supervisé
Snell Jake Swersky Kevin Zemel Richard S.
Résumé
Nous proposons les réseaux prototypiques pour le problème de la classification à faibles exemples, dans lequel un classificateur doit généraliser à de nouvelles classes non observées lors de l'apprentissage, à partir d'un nombre réduit d'exemples pour chaque nouvelle classe. Les réseaux prototypiques apprennent un espace métrique dans lequel la classification s'effectue en calculant les distances par rapport aux représentations prototypes de chaque classe. Par rapport aux approches récentes en apprentissage à faibles exemples, ils incarnent une hypothèse inductive plus simple, qui s'avère particulièrement avantageuse dans un régime à données limitées, tout en obtenant de très bons résultats. Nous fournissons une analyse démontrant que certaines décisions de conception simples peuvent conduire à des améliorations significatives par rapport à des approches récentes reposant sur des choix architecturaux complexes et des mécanismes d'apprentissage métacognitif. Nous étendons par ailleurs les réseaux prototypiques au cadre de l'apprentissage zéro-shot, où nous atteignons des résultats de pointe sur le jeu de données CU-Birds.