HyperAIHyperAI
il y a 2 mois

Amélioration du Prototype Universel pour la Détection d'Objets en Few-Shot

Aming Wu; Yahong Han; Linchao Zhu; Yi Yang
Amélioration du Prototype Universel pour la Détection d'Objets en Few-Shot
Résumé

La détection d'objets à faible nombre de clichés (Few-Shot Object Detection, FSOD) vise à renforcer la performance de la détection d'objets inédits avec peu d'échantillons étiquetés. Pour atténuer la contrainte liée au faible nombre d'échantillons, l'amélioration de la capacité de généralisation des caractéristiques apprises pour les objets inédits joue un rôle crucial. Par conséquent, le processus d'apprentissage des caractéristiques dans le FSOD devrait se concentrer davantage sur les caractéristiques intrinsèques des objets, qui restent invariantes face à divers changements visuels et sont donc utiles pour la généralisation des caractéristiques. Contrairement aux tentatives précédentes basées sur le paradigme de l'apprentissage métier, dans cet article, nous explorons comment améliorer les caractéristiques des objets avec des caractéristiques intrinsèques universelles qui s'appliquent à différentes catégories d'objets. Nous proposons un nouveau prototype, appelé prototype universel, qui est appris à partir de toutes les catégories d'objets. Outre l'avantage de représenter des caractéristiques invariantes, les prototypes universels atténuent l'impact des catégories d'objets déséquilibrées. Après avoir amélioré les caractéristiques des objets avec ces prototypes universels, nous appliquons une perte de cohérence pour maximiser l'accord entre les caractéristiques améliorées et les originales, ce qui est bénéfique pour l'apprentissage de caractéristiques invariantes d'objets. Ainsi, nous développons un nouveau cadre de détection d'objets à faible nombre de clichés avec prototypes universels ({FSOD}^{up}), qui possède le mérite de la généralisation des caractéristiques vers les objets inédits. Les résultats expérimentaux sur PASCAL VOC et MS COCO montrent l'efficacité de {FSOD}^{up}. En particulier, pour le cas 1-shot du VOC Split2, {FSOD}^{up} surpassant la ligne de base de 6,8 % en termes de mAP.

Amélioration du Prototype Universel pour la Détection d'Objets en Few-Shot | Articles de recherche récents | HyperAI