HyperShot : Apprentissage peu supervisé par des HyperRéseaux à noyaux

Les modèles few-shot visent à effectuer des prédictions à l’aide d’un nombre minimal d’exemples étiquetés provenant d’une tâche donnée. Le défi principal dans ce domaine réside dans le cadre one-shot, où un seul exemple représente chaque classe. Nous proposons HyperShot, une fusion entre les noyaux (kernels) et le paradigme des hyperréseaux. Contrairement aux approches de référence qui procèdent à un ajustement basé sur les gradients des paramètres, notre modèle vise à modifier dynamiquement les paramètres du module de classification en fonction de l’embedding de la tâche. En pratique, nous utilisons un hyperréseau qui prend en entrée l’information agrégée provenant des exemples de support et renvoie les paramètres du classificateur spécifiquement conçus pour la tâche considérée. En outre, nous introduisons une représentation basée sur les noyaux des exemples de support, fournie à l’hyperréseau afin de générer les paramètres du module de classification. Ainsi, notre approche repose sur les relations entre les embeddings des exemples de support, plutôt que sur les valeurs de caractéristiques directes fournies par les modèles de base (backbone). Grâce à cette stratégie, notre modèle parvient à s’adapter efficacement à des tâches très différentes.