HyperAIHyperAI

Command Palette

Search for a command to run...

ZoomNeXt : Un réseau pyramidal collaboratif unifié pour la détection d'objets camouflés

Youwei Pang Xiaoqi Zhao Tian-Zhu Xiang Lihe Zhang Huchuan Lu

Résumé

Les tentatives récentes de détection d'objets camouflés (COD) visent à segmenter des objets visuellement fondus dans leur environnement, ce qui est extrêmement complexe et difficile dans des scénarios du monde réel. Outre la forte similarité intrinsèque entre les objets camouflés et leur arrière-plan, ces objets sont généralement divers en taille, flous en apparence et même fortement occultés. À cet égard, nous proposons un réseau pyramidal collaboratif unifié efficace qui imite le comportement humain lors de l'observation d'images et de vidéos vagues, c'est-à-dire le zoom avant et arrière.Plus précisément, notre approche utilise la stratégie de zoom pour apprendre des sémantiques mixtes à différentes échelles grâce aux unités d'intégration multi-échelle et de perception granulaire riche. Ces unités sont conçues pour exploiter pleinement les indices imperceptibles entre les objets candidats et leurs arrière-plans. L'agrégation multi-têtes intrinsèque de l'une fournit des motifs visuels plus variés. Le mécanisme de routage de l'autre peut propager efficacement les différences inter-images dans des scénarios spatio-temporels et être désactivé de manière adaptative pour produire des résultats nuls pour les représentations statiques. Ils fournissent une base solide pour réaliser une architecture unifiée pour la COD statique et dynamique.De plus, en tenant compte de l'incertitude et de l'ambiguïté issues des textures indiscernables, nous construisons une régularisation simple mais efficace, appelée perte de conscience de l'incertitude (uncertainty awareness loss), pour encourager des prédictions avec une confiance plus élevée dans les régions candidates. Notre cadre très adapté à la tâche surpasse constamment les méthodes existantes d'avant-garde dans les benchmarks de détection d'objets camouflés sur images et vidéos. Notre code est disponible à l'adresse suivante : {https://github.com/lartpang/ZoomNeXt}.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp