HyperAIHyperAI
il y a 11 jours

SelfReformer : réseau auto-amélioré basé sur le Transformer pour la détection d'objets saillants

Yi Ke Yun, Weisi Lin
SelfReformer : réseau auto-amélioré basé sur le Transformer pour la détection d'objets saillants
Résumé

Les contextes globaux et locaux contribuent de manière significative à l'intégrité des prédictions dans la détection d'objets saillants (SOD). Malheureusement, les méthodes existantes peinent encore à produire des prédictions complètes avec des détails fins. Deux problèmes majeurs persistent dans les approches conventionnelles : tout d'abord, concernant le contexte global, les caractéristiques extraites par les encodeurs basés sur les réseaux de neurones convolutifs (CNN) de haut niveau ne parviennent pas efficacement à capturer les dépendances à longue portée, entraînant des prédictions incomplètes. Ensuite, le redimensionnement de l'étiquette de vérité terrain (ground truth) pour correspondre à la taille des prédictions introduit une inexactitude, car les détails de la vérité terrain sont perdus lors des opérations d'interpolation ou de pooling. Ainsi, dans ce travail, nous avons conçu un réseau basé sur les Transformers et formulé une tâche supervisée pour une branche afin d'apprendre explicitement les informations de contexte global. Par ailleurs, nous avons adopté l'opération Pixel Shuffle issue de la super-résolution (SR) pour redimensionner les prédictions vers la taille de la vérité terrain, plutôt que d'effectuer l'opération inverse, préservant ainsi intégralement les détails de la vérité terrain. En outre, nous avons développé un module à deux étapes de raffinement du contexte (CRM) pour fusionner le contexte global et localiser automatiquement ainsi que raffiner les détails locaux dans les prédictions. Le réseau proposé peut ainsi s'auto-corrigé en s'appuyant sur le contexte global et local généré, d’où son nom : Self-Refined Transformer (SelfReformer). Des expérimentations abondantes et des résultats d’évaluation sur cinq jeux de données de référence démontrent les performances exceptionnelles du réseau, atteignant ainsi l’état de l’art.

SelfReformer : réseau auto-amélioré basé sur le Transformer pour la détection d'objets saillants | Articles de recherche récents | HyperAI