Raffinement des échantillons positifs à plusieurs échelles pour la détection d'objets en peu d'exemples

La détection d'objets en peu d'exemples (FSOD) permet aux détecteurs d'adapter leur reconnaissance à des classes non vues à partir d'un nombre réduit d'instances d'entraînement, ce qui s'avère particulièrement utile lorsque l'annotation manuelle est chronophage ou que l'acquisition de données est limitée. Contrairement aux approches antérieures qui exploitaient des techniques de classification en peu d'exemples pour faciliter la FSOD, ce travail met en évidence la nécessité de traiter le problème des variations d'échelle, qui est particulièrement difficile en raison de la distribution d'échantillons unique. À cette fin, nous proposons une méthode appelée Réfinement multi-échelle des échantillons positifs (MPSR), visant à enrichir la diversité des échelles des objets dans le cadre de la FSOD. Cette approche génère des échantillons positifs à plusieurs échelles sous forme de pyramides d'objets et affine les prédictions à différentes échelles. Nous démontrons son efficacité en l'intégrant comme branche auxiliaire dans l'architecture populaire Faster R-CNN avec FPN, offrant ainsi une solution puissante pour la FSOD. Plusieurs expériences ont été menées sur les jeux de données PASCAL VOC et MS COCO, où la méthode proposée atteint des résultats de pointe et surpasse significativement les autres approches existantes, confirmant ainsi son efficacité. Le code est disponible à l'adresse suivante : https://github.com/jiaxi-wu/MPSR.