HyperAIHyperAI
il y a 2 mois

Crowd-SAM : SAM en tant qu'Annotateur Intelligent pour la Détection d'Objets dans des Scènes Denses

Cai, Zhi ; Gao, Yingjie ; Zheng, Yaoyan ; Zhou, Nan ; Huang, Di
Crowd-SAM : SAM en tant qu'Annotateur Intelligent pour la Détection d'Objets dans des Scènes Denses
Résumé

Dans le domaine de la vision par ordinateur, la détection d'objets est une tâche importante qui trouve son application dans de nombreux scénarios. Cependant, l'obtention d'étiquettes exhaustives peut être un défi, en particulier dans les scènes surpeuplées. Récemment, le modèle Segment Anything Model (SAM) a été proposé comme un segmenteur puissant à zéro coup d'œil, offrant une approche novatrice pour les tâches de segmentation d'instances. Néanmoins, la précision et l'efficacité du SAM et de ses variantes sont souvent compromises lorsqu'ils traitent des objets dans des scènes surpeuplées et occultées. Dans cet article, nous présentons Crowd-SAM, un cadre basé sur SAM conçu pour améliorer les performances de SAM dans les scènes surpeuplées et occultées, avec un coût minimal en termes de paramètres apprenables et d'images étiquetées. Nous introduisons un échantillonneur de prompts efficace (EPS) et un réseau de discrimination partie-ensemble (PWD-Net), améliorant ainsi la sélection des masques et la précision dans les scènes surpeuplées. Malgré sa simplicité, Crowd-SAM rivalise avec les méthodes actuelles d'état de l'art (SOTA) pour la détection d'objets entièrement supervisée sur plusieurs benchmarks, dont CrowdHuman et CityPersons. Notre code est disponible à l'adresse suivante : https://github.com/FelixCaae/CrowdSAM.

Crowd-SAM : SAM en tant qu'Annotateur Intelligent pour la Détection d'Objets dans des Scènes Denses | Articles de recherche récents | HyperAI