HyperAIHyperAI
il y a 3 mois

Détection d'objets à faible exemple avec réponse instantanée grâce à une stratégie méta et une inférence explicite de localisation

Junying Huang, Fan Chen, Sibo Huang, Dongyu Zhang
Détection d'objets à faible exemple avec réponse instantanée grâce à une stratégie méta et une inférence explicite de localisation
Résumé

Visant à reconnaître et localiser des objets appartenant à de nouvelles catégories à partir de très peu d'exemples de référence, la détection d'objets en peu de tirages (few-shot object detection, FSOD) constitue une tâche particulièrement exigeante. Les travaux antérieurs s'appuient souvent sur un processus de fine-tuning pour adapter leurs modèles aux nouvelles catégories, tout en négligeant fréquemment les défauts inhérents à ce processus, ce qui entraîne de nombreux inconvénients pratiques. Par exemple, ces méthodes se révèlent insatisfaisantes dans des scénarios où les épisodes (i.e., les ensembles de support) changent fréquemment en raison d'un nombre excessif de fine-tunings, et leur performance se dégrade fortement sur des ensembles de support de mauvaise qualité (par exemple, en nombre très restreint ou incomplets par rapport aux classes). Afin de remédier à ces limitations, ce papier propose un détecteur de nouveaux objets en peu de tirages à réponse instantanée (IR-FSOD), capable de détecter précisément et directement les objets de nouvelles catégories sans passer par un processus de fine-tuning. Pour atteindre cet objectif, nous analysons en détail les faiblesses des modules individuels du cadre Faster R-CNN dans le contexte de la FSOD, puis améliorons ce cadre pour le transformer en IR-FSOD. Plus précisément, nous proposons deux stratégies métas simples mais efficaces pour le classificateur de boîtes et le module RPN, permettant ainsi une détection instantanée des objets de nouvelles catégories. Ensuite, nous introduisons deux mécanismes d'inférence explicites dans le module de localisation afin de réduire son sur-apprentissage aux catégories de base, notamment une note de localisation explicite et une régression de boîte semi-explicite. Des expériences étendues montrent que le cadre IR-FSOD non seulement permet une détection d'objets en peu de tirages avec réponse instantanée, mais atteint également des performances de pointe en termes de précision et de rappel dans diverses configurations de FSOD.

Détection d'objets à faible exemple avec réponse instantanée grâce à une stratégie méta et une inférence explicite de localisation | Articles de recherche | HyperAI