HyperAIHyperAI
il y a 2 mois

Référence Bilatérale pour le Segmentation d'Images Dichotomiques à Haute Résolution

Zheng, Peng ; Gao, Dehong ; Fan, Deng-Ping ; Liu, Li ; Laaksonen, Jorma ; Ouyang, Wanli ; Sebe, Nicu
Référence Bilatérale pour le Segmentation d'Images Dichotomiques à Haute Résolution
Résumé

Nous présentons un nouveau cadre de référence bilatéral (BiRefNet) pour la segmentation d'images dichotomiques à haute résolution (DIS). Ce cadre comprend deux composants essentiels : le module de localisation (LM) et le module de reconstruction (RM) avec notre proposition de référence bilatérale (BiRef). Le LM aide à la localisation des objets en utilisant des informations sémantiques globales. Dans le RM, nous utilisons BiRef pour le processus de reconstruction, où les patchs hiérarchiques d'images fournissent la référence source et les cartes de gradient servent de référence cible. Ces composants collaborent pour générer les cartes prédites finales. Nous introduisons également une supervision aux gradients auxiliaire afin d'améliorer la focalisation sur les régions à détails plus fins. De plus, nous exposons des stratégies d'entraînement pratiques adaptées au DIS pour améliorer la qualité des cartes et le processus d'entraînement. Pour valider l'applicabilité générale de notre approche, nous menons des expériences approfondies sur quatre tâches, démontrant que BiRefNet présente des performances remarquables, surpassant les méthodes les plus avancées spécifiques à chaque tâche dans tous les benchmarks. Nos codes sont disponibles sur https://github.com/ZhengPeng7/BiRefNet.

Référence Bilatérale pour le Segmentation d'Images Dichotomiques à Haute Résolution | Articles de recherche récents | HyperAI