Réseau de raffinement alternatif guidé progressivement pour la détection d'objets saillants RGB-D

Dans cet article, nous visons à développer un réseau neuronal profond efficace et compact pour la détection d'objets saillants en RGB-D, où l'image de profondeur fournit des informations complémentaires pour améliorer les performances dans des scénarios complexes. Partant d'une prédiction initiale grossière réalisée par un bloc résiduel multi-échelle, nous proposons un réseau de raffinement alternatif guidé progressivement pour l'affiner. Au lieu d'utiliser un réseau de base pré-entraîné sur ImageNet, nous construisons d'abord une branche légère de profondeur en apprenant à partir de zéro, ce qui permet d'extraire des caractéristiques complémentaires plus efficacement avec moins de redondance. Ensuite, contrairement aux méthodes existantes basées sur la fusion, les caractéristiques RGB et de profondeur sont introduites alternativement dans les blocs résiduels guidés (GR) proposés pour réduire leur dégradation mutuelle. En attribuant une guidance progressive dans les blocs GR empilés au sein de chaque sortie latérale, les fausses détections et les parties manquantes peuvent être corrigées efficacement. De nombreuses expériences menées sur sept jeux de données de référence montrent que notre modèle surpassent largement les approches actuelles de pointe et présente également une supériorité en termes d'efficacité (71 FPS) et de taille du modèle (64,9 Mo).