Vers une détection d'objets saillants à haute résolution

Les méthodes basées sur les réseaux de neurones profonds ont réalisé une percée significative dans la détection d'objets saillants. Cependant, elles sont généralement limitées aux images d'entrée de faible résolution (400×400 pixels ou moins). Peu d'efforts ont été consacrés à l'entraînement de réseaux de neurones profonds pour traiter directement la détection d'objets saillants dans des images de très haute résolution. Cet article avance dans le domaine de la détection de saillance en haute résolution et contribue avec un nouveau jeu de données, nommé High-Resolution Salient Object Detection (HRSOD). À notre meilleure connaissance, HRSOD est le premier jeu de données de détection de saillance en haute résolution à ce jour. Comme contribution supplémentaire, nous proposons également une nouvelle approche qui intègre à la fois les informations sémantiques globales et les détails locaux en haute résolution pour relever ce défi complexe. Plus précisément, notre approche comprend un Réseau Sémantique Global (GSN), un Réseau de Raffinement Local (LRN) et un Réseau de Fusion Globale-Locale (GLFN). Le GSN extrait les informations sémantiques globales à partir d'une image entière sous-échantillonnée. Guidé par les résultats du GSN, le LRN se concentre sur certaines régions locales et produit progressivement des prédictions en haute résolution. Le GLFN est proposé pour renforcer la cohérence spatiale et améliorer les performances. Les expériences montrent que notre méthode surpassent largement les méthodes existantes de pointe sur des jeux de données de saillance en haute résolution, et atteint des performances comparables voire supérieures sur des benchmarks couramment utilisés. Le jeu de données HRSOD est disponible à l'adresse suivante : https://github.com/yi94code/HRSOD.