Regionale interaktive Bildsegmentierungsnetzwerke

Das interaktive Bildsegmentierungsmodell ermöglicht es Benutzern, schrittweise neue Eingaben hinzuzufügen, um die Segmentierung kontinuierlich zu verfeinern, bis schließlich ein zufriedenstellendes Ergebnis erzielt wird. Daher sollte ein ideales interaktives Segmentierungsmodell in der Lage sein, die Absicht des Benutzers mit minimalem Interaktionsaufwand zu erfassen. Derzeitige Modelle nutzen jedoch die wertvollen Informationen aus den Benutzereingaben im Prozess der Segmentierungsverfeinerung nicht vollständig und bieten daher eine unbefriedigende Benutzererfahrung. Um die von Benutzern bereitgestellten Informationen optimal auszunutzen, schlagen wir einen neuen tiefen Rahmenwerk, namens Regional Interactive Segmentation Network (RIS-Net), vor, der den Sichtbereich der gegebenen Eingaben erweitert, um die lokalen regionalen Informationen in deren Umgebung zu erfassen und so eine lokale Verfeinerung zu ermöglichen. Zudem integriert RIS-Net multiskalare globale Kontextinformationen, um jede lokale Region zu ergänzen und die Merkmalsdarstellung zu verbessern. Außerdem führen wir Klick-Discount-Faktoren ein, um eine neuartige Optimierungsstrategie für eine effektivere end-to-end-Trainingsprozedur zu entwickeln. Umfassende Bewertungen an vier anspruchsvollen Datensätzen belegen eindeutig die Überlegenheit des vorgeschlagenen RIS-Net im Vergleich zu anderen state-of-the-art-Ansätzen.