Détection d'objets à quelques exemples de manière frustrante simple

La détection d'objets rares à partir de quelques exemples est un problème émergent. Les travaux antérieurs montrent que le méta-apprentissage est une approche prometteuse. Cependant, les techniques de fine-tuning n'ont guère attiré l'attention. Nous avons découvert que le fine-tuning uniquement de la dernière couche des détecteurs existants sur les classes rares est crucial pour la tâche de détection d'objets en few-shot. Cette approche simple dépasse les méthodes de méta-apprentissage d'environ 2 à 20 points sur les benchmarks actuels et parfois même double la précision des méthodes précédentes. Cependant, la forte variance dans les quelques exemples disponibles conduit souvent à l'instabilité des benchmarks existants. Nous révisons les protocoles d'évaluation en échantillonnant plusieurs groupes d'exemples d'apprentissage afin d'obtenir des comparaisons stables et construisons de nouveaux benchmarks basés sur trois jeux de données : PASCAL VOC, COCO et LVIS. Une fois encore, notre approche de fine-tuning établit un nouveau niveau d'état de l'art sur ces benchmarks révisés. Le code ainsi que les modèles pré-entraînés sont disponibles à l'adresse suivante : https://github.com/ucbdrive/few-shot-object-detection.