Décompte d'objets : Il vous suffit de regarder une seule fois

Cette étude vise à aborder la tâche exigeante du comptage d'objets à partir d'un seul exemple (one-shot object counting). Étant donné une image contenant des objets appartenant à une catégorie nouvelle et auparavant inconnue, l'objectif consiste à compter tous les exemplaires de cette catégorie cible, en ne disposant que d'un unique exemple de boîte englobante (bounding box) de support. À cette fin, nous proposons un modèle de comptage appelé LaoNet, qui repose sur le principe de « regarder une seule instance » (Look At One instance). Premièrement, un module de corrélation de caractéristiques combine les modules d'attention auto-associative (Self-Attention) et d'attention corrélative (Correlative-Attention) afin d'apprendre à la fois les relations internes et les relations inter-objets. Ce mécanisme permet au réseau d'être robuste face aux incohérences dues aux rotations et aux tailles variables entre les instances. Deuxièmement, une mécanique d'agrégation à plusieurs échelles est conçue pour extraire efficacement des caractéristiques à différentes échelles. Par rapport aux méthodes existantes de comptage à faible exemplaire (few-shot counting), LaoNet atteint des résultats de pointe tout en présentant une vitesse de convergence élevée. Le code source sera bientôt rendu disponible.