Command Palette
Search for a command to run...
Réseau récurrent à attention multi-échelle induite par la profondeur pour la détection de la saillance
Réseau récurrent à attention multi-échelle induite par la profondeur pour la détection de la saillance
Huchuan Lu Miao Zhang Jingjing Li Wei Ji Yongri Piao
Résumé
Dans ce travail, nous proposons un nouveau réseau récurrent à attention multi-échelle piloté par la profondeur pour la détection de la salience. Ce modèle atteint des performances remarquables, en particulier dans des scénarios complexes. Notre architecture présente trois contributions majeures, expérimentalement démontrées pour leurs avantages pratiques significatifs. Premièrement, nous concevons un bloc d’affinement de profondeur efficace basé sur des connexions résiduelles, permettant d’extraire et de fusionner pleinement des indices complémentaires multi-niveaux provenant des flux RGB et profondeur. Deuxièmement, nous combinons de manière innovante les indices de profondeur, riches en informations spatiales, avec des caractéristiques contextuelles multi-échelles afin de localiser précisément les objets saillants. Troisièmement, nous améliorons les performances de notre modèle grâce à un nouveau module d’attention récurrente inspiré du mécanisme génératif interne du cerveau humain. Ce module permet de générer des résultats de salience plus précis en apprenant de manière exhaustive les relations sémantiques internes des caractéristiques fusionnées, tout en optimisant progressivement les détails locaux grâce à une compréhension scénique orientée mémoire. En outre, nous avons construit un grand jeu de données RGB-D, comprenant des scénarios plus complexes, qui contribuera à une évaluation complète des modèles de détection de salience. Des expérimentations étendues sur six jeux de données publics ainsi que sur le nôtre montrent que notre méthode parvient à identifier avec précision les objets saillants et obtient des performances supérieures et constantes par rapport à 16 approches de pointe en RGB et RGB-D.