HyperAIHyperAI
il y a 2 mois

Zoom avant et arrière : Un réseau de triplets à échelle mixte pour la détection d'objets camouflés

Pang, Youwei ; Zhao, Xiaoqi ; Xiang, Tian-Zhu ; Zhang, Lihe ; Lu, Huchuan
Zoom avant et arrière : Un réseau de triplets à échelle mixte pour la détection d'objets camouflés
Résumé

La détection d'objets camouflés (DOD) récemment proposée vise à segmenter des objets qui sont visuellement fondus dans leur environnement, ce qui est extrêmement complexe et difficile dans des scénarios du monde réel. Outre la forte similarité intrinsèque entre les objets camouflés et leur arrière-plan, ces objets présentent généralement une diversité d'échelles, une apparence floue et peuvent même être fortement occultés. Pour faire face à ces problèmes, nous proposons un réseau de triplets à échelle mixte, \textbf{ZoomNet}, qui imite le comportement humain lors de l'observation d'images floues, c'est-à-dire le zoom avant et arrière. Plus précisément, notre ZoomNet utilise la stratégie de zoom pour apprendre des sémantiques mixtes discriminantes grâce à l'unité d'intégration d'échelle et l'unité hiérarchique mixte conçues, explorant pleinement les indices imperceptibles entre les objets candidats et leur environnement arrière. De plus, en considérant l'incertitude et l'ambiguïté issues des textures indiscernables, nous avons élaboré une contrainte de régularisation simple mais efficace, la perte consciente de l'incertitude (uncertainty-aware loss), pour inciter le modèle à produire des prédictions précises avec une plus grande confiance dans les régions candidates. Sans artifices superflus, notre modèle hautement adapté à la tâche surpasse constamment les 23 méthodes existantes de pointe sur quatre jeux de données publics. De plus, sa supériorité par rapport aux modèles récents de pointe dans la tâche SOD (Single Object Detection) confirme également l'efficacité et la généralité de notre modèle. Le code sera disponible à l'adresse \url{https://github.com/lartpang/ZoomNet}.

Zoom avant et arrière : Un réseau de triplets à échelle mixte pour la détection d'objets camouflés | Articles de recherche récents | HyperAI