Désentrelacement de la détection d'objets saillants de haute qualité

Visant à découvrir et localiser les objets les plus distinctifs dans des scènes visuelles, la détection d'objets saillants (SOD) joue un rôle essentiel dans divers systèmes de vision par ordinateur. Avec l'ère de haute résolution, les méthodes SOD sont confrontées à de nouveaux défis. La principale limitation des méthodes précédentes est qu'elles tentent d'identifier les régions saillantes et d'estimer précisément les contours des objets simultanément avec une seule tâche de régression à faible résolution. Cette pratique ignore la différence inhérente entre ces deux problèmes difficiles, entraînant une qualité de détection médiocre. Dans cet article, nous proposons un nouveau cadre d'apprentissage profond pour la tâche SOD en haute résolution, qui dissocie cette tâche en un réseau de classification de saillance à faible résolution (LRSCN) et un réseau de raffinement en haute résolution (HRRN). En tant que tâche de classification pixel par pixel, le LRSCN est conçu pour capturer suffisamment de sémantique à faible résolution afin d'identifier les régions définitivement saillantes, le fond et les régions incertaines des images. Le HRRN est une tâche de régression qui vise à affiner précisément la valeur de saillance des pixels dans la région incertaine pour préserver une frontière d'objet claire en haute résolution tout en utilisant une quantité limitée de mémoire GPU. Il convient de noter que l'introduction de l'incertitude dans le processus d'entraînement permet à notre HRRN d'aborder efficacement la tâche de raffinement en haute résolution sans utiliser aucune donnée d'entraînement en haute résolution. De nombreuses expériences sur des jeux de données de saillance en haute résolution ainsi que sur certains benchmarks largement utilisés montrent que la méthode proposée atteint des performances supérieures par rapport aux méthodes les plus avancées actuellement disponibles.