Réseau d'attention hiérarchique pour la détection d'objets à faible exemple par apprentissage méta-contrastif

La détection d’objets à peu de exemples (FSOD) vise à classifier et détecter des images rares appartenant à de nouvelles catégories. Les méthodes existantes basées sur le meta-learning exploite insuffisamment les caractéristiques entre les images de support et les images de requête en raison de limitations structurelles. Nous proposons un réseau d’attention hiérarchique doté de champs réceptifs successivement larges, afin d’exploiter pleinement les informations contenues dans les images de support et de requête. En outre, le meta-learning ne parvient pas à bien distinguer les catégories, car il détermine simplement si les images de support et de requête correspondent. Autrement dit, l’apprentissage basé sur une métrique pour la classification s’avère inefficace, car il ne fonctionne pas directement. Ainsi, nous introduisons une méthode d’apprentissage contrastif appelée meta-contrastive learning, qui contribue directement à atteindre l’objectif de la stratégie de meta-learning. Enfin, nous établissons un nouveau modèle d’état de l’art, en réalisant des marges significatives. Notre méthode améliore les performances de 2,3 %, 1,0 %, 1,3 %, 3,4 % et 2,4 % en AP pour la détection d’objets à 1 à 30 exemples sur le jeu de données COCO. Notre code est disponible à l’adresse suivante : https://github.com/infinity7428/hANMCL