HyperAIHyperAI
il y a 17 jours

Squeeze-and-Excitation contextuelle pour une classification d’images à faible exemplaire efficace

Massimiliano Patacchiola, John Bronskill, Aliaksandra Shysheya, Katja Hofmann, Sebastian Nowozin, Richard E. Turner
Squeeze-and-Excitation contextuelle pour une classification d’images à faible exemplaire efficace
Résumé

Ces dernières années, on a assisté à une croissance des applications centrées sur l’utilisateur, nécessitant un transfert efficace des connaissances entre tâches dans un régime à faible quantité de données. Un exemple typique est la personnalisation, où un modèle préentraîné est adapté en apprenant à partir de petites quantités de données étiquetées spécifiques à un utilisateur donné. Ce cadre exige une haute précision tout en maintenant une faible complexité computationnelle, ce qui rend la frontière de Pareto entre précision et coût d’adaptation particulièrement cruciale. Dans cet article, nous améliorons cette frontière de Pareto dans le cadre de la classification d’images en peu de exemples, grâce à une contribution majeure : une nouvelle unité adaptative appelée Contextual Squeeze-and-Excitation (CaSE), qui ajuste un réseau neuronal préentraîné à une nouvelle tâche en améliorant significativement les performances grâce à une seule passe avant des données utilisateur (contexte). Nous utilisons des blocs CaSE entraînés par méta-apprentissage pour adapter conditionnellement le corps du réseau, tandis qu’une procédure de fine-tuning s’occupe de l’adaptation de la tête linéaire, définissant ainsi une méthode appelée UpperCaSE. UpperCaSE atteint un nouveau record de précision par rapport aux méta-apprentissages sur les 26 jeux de données du benchmark VTAB+MD, ainsi que sur un défi réeliste de personnalisation (ORBIT), réduisant considérablement l’écart par rapport aux méthodes de fine-tuning les plus performantes, tout en offrant un coût d’adaptation inférieur d’un ordre de grandeur ou plus.