HyperAIHyperAI
il y a 17 jours

Requête dense distincte pour la détection d'objets bout-en-bout

Shilong Zhang, Xinjiang Wang, Jiaqi Wang, Jiangmiao Pang, Chengqi Lyu, Wenwei Zhang, Ping Luo, Kai Chen
Requête dense distincte pour la détection d'objets bout-en-bout
Résumé

L’attribution un-à-un des étiquettes dans la détection d’objets a réussi à éliminer le besoin de suppression non maximale (NMS) en post-traitement, rendant ainsi le pipeline entièrement end-to-end. Toutefois, cela a soulevé un nouveau dilemme : les requêtes creuses couramment utilisées ne garantissent pas un taux de rappel élevé, tandis que les requêtes denses entraînent inévitablement une surabondance de requêtes similaires, posant des difficultés d’optimisation. Étant donné que tant les requêtes creuses que les requêtes denses présentent des limites, quelles sont alors les requêtes idéales dans le cadre de la détection d’objets end-to-end ? Ce papier montre que la solution réside dans les Requêtes Denses Distinctes (DDQ). Plus précisément, nous initialisons d’abord des requêtes denses comme dans les détecteurs traditionnels, puis sélectionnons parmi elles celles qui sont distinctes afin de permettre une attribution un-à-un. La méthode DDQ combine les avantages des détecteurs traditionnels et des détecteurs end-to-end récents, et améliore significativement les performances de divers détecteurs, notamment FCN, R-CNN et DETR. Plus impressionnant encore, le modèle DDQ-DETR atteint un score de 52,1 AP sur le jeu de données MS-COCO en seulement 12 époques, en utilisant un squelette ResNet-50, surpassant ainsi tous les détecteurs existants dans les mêmes conditions. La DDQ partage également les avantages des détecteurs end-to-end dans les scènes surpeuplées, atteignant un score de 93,8 AP sur CrowdHuman. Nous espérons que la DDQ inspirera les chercheurs à explorer la complémentarité entre les méthodes traditionnelles et les détecteurs end-to-end. Le code source est disponible à l’adresse suivante : \url{https://github.com/jshilong/DDQ}.