A2dele : Distillateur de profondeur adaptatif et attentif pour une détection efficace des objets saillants en RGB-D

Les méthodes d’actualité en détection de objets saillants en RGB-D s’appuient sur une architecture à deux flux, dans laquelle un sous-réseau indépendant est nécessaire pour traiter les données de profondeur. Cela entraîne inévitablement des coûts computationnels supplémentaires et une consommation mémoire accrue, et l’utilisation des données de profondeur lors du test peut entraver les applications pratiques de la détection saillante en RGB-D. Pour résoudre ces deux problèmes, nous proposons un distillateur de profondeur (A2dele), qui exploite les prédictions du réseau et la carte d’attention comme deux ponts pour transférer les connaissances de profondeur du flux de profondeur vers le flux RGB. Premièrement, en minimisant de manière adaptative les différences entre les prédictions issues du flux de profondeur et celles du flux RGB, nous parvenons à contrôler précisément le transfert des connaissances de profondeur au niveau des pixels vers le flux RGB. Deuxièmement, afin de transférer les connaissances de localisation vers les caractéristiques RGB, nous encourageons la cohérence entre la prédiction dilatée du flux de profondeur et la carte d’attention issue du flux RGB. En conséquence, nous obtenons une architecture légère, ne nécessitant pas l’utilisation des données de profondeur au moment du test, grâce à l’intégration de notre A2dele. Une évaluation expérimentale étendue sur cinq benchmarks démontre que notre flux RGB atteint des performances de pointe, réduisant considérablement la taille du modèle de 76 % et accélérant son exécution jusqu’à 12 fois par rapport à la méthode la plus performante. En outre, notre A2dele peut être appliqué à des réseaux RGB-D existants afin d’améliorer significativement leur efficacité tout en préservant leurs performances (amélioration de près du double des FPS pour DMRA, et de trois fois pour CPFP).