HyperAIHyperAI
il y a 2 mois

ZoomNeXt : Un réseau pyramidal collaboratif unifié pour la détection d'objets camouflés

Pang, Youwei ; Zhao, Xiaoqi ; Xiang, Tian-Zhu ; Zhang, Lihe ; Lu, Huchuan
ZoomNeXt : Un réseau pyramidal collaboratif unifié pour la détection d'objets camouflés
Résumé

Les tentatives récentes de détection d'objets camouflés (COD) visent à segmenter des objets visuellement fondus dans leur environnement, ce qui est extrêmement complexe et difficile dans des scénarios du monde réel. Outre la forte similarité intrinsèque entre les objets camouflés et leur arrière-plan, ces objets sont généralement divers en taille, flous en apparence et même fortement occultés. À cet égard, nous proposons un réseau pyramidal collaboratif unifié efficace qui imite le comportement humain lors de l'observation d'images et de vidéos vagues, c'est-à-dire le zoom avant et arrière.Plus précisément, notre approche utilise la stratégie de zoom pour apprendre des sémantiques mixtes à différentes échelles grâce aux unités d'intégration multi-échelle et de perception granulaire riche. Ces unités sont conçues pour exploiter pleinement les indices imperceptibles entre les objets candidats et leurs arrière-plans. L'agrégation multi-têtes intrinsèque de l'une fournit des motifs visuels plus variés. Le mécanisme de routage de l'autre peut propager efficacement les différences inter-images dans des scénarios spatio-temporels et être désactivé de manière adaptative pour produire des résultats nuls pour les représentations statiques. Ils fournissent une base solide pour réaliser une architecture unifiée pour la COD statique et dynamique.De plus, en tenant compte de l'incertitude et de l'ambiguïté issues des textures indiscernables, nous construisons une régularisation simple mais efficace, appelée perte de conscience de l'incertitude (uncertainty awareness loss), pour encourager des prédictions avec une confiance plus élevée dans les régions candidates. Notre cadre très adapté à la tâche surpasse constamment les méthodes existantes d'avant-garde dans les benchmarks de détection d'objets camouflés sur images et vidéos. Notre code est disponible à l'adresse suivante : {https://github.com/lartpang/ZoomNeXt}.

ZoomNeXt : Un réseau pyramidal collaboratif unifié pour la détection d'objets camouflés | Articles de recherche récents | HyperAI