HyperAIHyperAI
il y a 11 jours

Réseau d'attention bilatérale pour la détection des objets saillants en RGB-D

Zhao Zhang, Zheng Lin, Jun Xu, Wenda Jin, Shao-Ping Lu, Deng-Ping Fan
Réseau d'attention bilatérale pour la détection des objets saillants en RGB-D
Résumé

La plupart des méthodes existantes de détection des objets saillants (SOD) en RGB-D se concentrent sur la région du premier plan lors de l’utilisation des images de profondeur. Toutefois, dans les méthodes traditionnelles de SOD, la région de fond apporte également des informations importantes, essentielles pour atteindre de bons résultats. Afin d’exploiter de manière plus efficace les informations saillantes présentes tant dans les régions du premier plan que dans celles du fond, cette étude propose un réseau à attention bilatérale (BiANet) pour la tâche de SOD en RGB-D. Plus précisément, nous introduisons un module d’attention bilatérale (BAM) reposant sur un mécanisme d’attention complémentaire : une attention « premier plan d’abord » (FF) et une attention « fond d’abord » (BF). L’attention FF se concentre sur la région du premier plan selon un style de raffinement progressif, tandis que l’attention BF permet de restaurer potentiellement des informations saillantes utiles dans la région du fond. Grâce au module BAM proposé, BiANet peut capter davantage d’indices significatifs tant dans le premier plan que dans le fond, et accorder davantage d’attention au raffinement des détails incertains situés entre ces deux régions. Par ailleurs, nous étendons notre BAM en exploitant des techniques multi-échelles afin d’améliorer encore les performances de SOD. Des expérimentations abondantes sur six jeux de données standard montrent que BiANet surpasser les autres méthodes de pointe en SOD RGB-D selon les métriques objectives ainsi que les évaluations visuelles subjectives. BiANet peut fonctionner à jusqu’à 80 fps sur des images RGB-D de taille $224\times224$, avec une GPU NVIDIA GeForce RTX 2080Ti. Des études d’ablation complètes confirment également la validité de nos contributions.

Réseau d'attention bilatérale pour la détection des objets saillants en RGB-D | Articles de recherche récents | HyperAI