HyperAIHyperAI
vor 2 Monaten

Bilaterale Referenz für die hochaufgelöste dichotome Bildsegmentierung

Zheng, Peng ; Gao, Dehong ; Fan, Deng-Ping ; Liu, Li ; Laaksonen, Jorma ; Ouyang, Wanli ; Sebe, Nicu
Bilaterale Referenz für die hochaufgelöste dichotome Bildsegmentierung
Abstract

Wir stellen einen neuen bilateralen Referenzrahmen (BiRefNet) für die hochaufgelöste dichotome Bildsegmentierung (DIS) vor. Dieser Rahmen besteht aus zwei wesentlichen Komponenten: dem Lokalisierungsmodul (LM) und dem Rekonstruktionsmodul (RM) mit unserem vorgeschlagenen bilateralen Referenzsystem (BiRef). Das LM unterstützt die Objektlokalisierung durch die Verwendung globaler semantischer Informationen. Im RM nutzen wir BiRef für den Rekonstruktionsprozess, bei dem hierarchische Bildabschnitte als Quellenreferenz dienen und Gradientenkarten als Zielreferenz fungieren. Diese Komponenten arbeiten zusammen, um die endgültigen vorhergesagten Karten zu generieren. Zudem führen wir eine zusätzliche Gradientensupervision ein, um den Fokus auf Regionen mit feineren Details zu verstärken. Des Weiteren beschreiben wir praktische Trainingsstrategien, die speziell für DIS entwickelt wurden, um die Kartenqualität und den Trainingsprozess zu verbessern. Um die allgemeine Anwendbarkeit unseres Ansatzes zu überprüfen, führen wir umfangreiche Experimente an vier Aufgaben durch, um zu zeigen, dass BiRefNet bemerkenswerte Leistungen erbringt und task-spezifische state-of-the-art-Methoden in allen Benchmarks übertreffen kann. Unser Code ist unter https://github.com/ZhengPeng7/BiRefNet verfügbar.

Bilaterale Referenz für die hochaufgelöste dichotome Bildsegmentierung | Neueste Forschungsarbeiten | HyperAI