Apprentissage par peu d'exemples par intégration des représentations spatiale et fréquentielle

Les êtres humains peuvent reconnaître de nouveaux objets à partir de très peu d'exemples étiquetés, mais l'apprentissage par peu d'exemples (few-shot learning) demeure un problème difficile pour les systèmes d'apprentissage automatique. La plupart des algorithmes précédents dans ce domaine n'exploitent que l'information spatiale des images. Dans cet article, nous proposons d'intégrer l'information fréquentielle dans le modèle d'apprentissage afin d'améliorer la capacité de discrimination du système. Nous utilisons la transformation en cosinus discrète (DCT) pour générer une représentation fréquentielle, puis combinons les caractéristiques provenant à la fois du domaine spatial et du domaine fréquentiel pour la classification. La stratégie proposée et son efficacité ont été validées sur différentes architectures, jeux de données et algorithmes. Des expériences étendues démontrent que l'information fréquentielle est complémentaire aux représentations spatiales dans le cadre de la classification par peu d'exemples. L'exactitude de classification est significativement améliorée en intégrant des caractéristiques provenant à la fois des domaines spatial et fréquentiel dans diverses tâches d'apprentissage par peu d'exemples.