FocusCut: Eintauchen in eine Fokusansicht bei der interaktiven Segmentierung

Interaktive Bildsegmentierung ist ein wesentliches Werkzeug für die pixelgenaue Annotation und Bildbearbeitung. Um eine hochpräzise binäre Segmentierungsmaske zu erzielen, tendieren Benutzer dazu, Interaktionsklicks um objektive Details wie Kanten und Löcher herum hinzuzufügen, um die Segmentierung effizient zu verfeinern. Aktuelle Methoden betrachten diese Korrekturklicks als Leitfaden, um gemeinsam die globale Vorhersage zu bestimmen. Allerdings führt die globale Perspektive dazu, dass das Modell die Aufmerksamkeit auf spätere Klicks verliert, was nicht mit den Absichten des Benutzers übereinstimmt. In diesem Artikel untersuchen wir die Perspektive der Klicks, um ihnen erneut eine entscheidende Rolle bei der Erfassung objektiver Details zu verleihen. Um die Notwendigkeit einer fokussierten Sichtweise zu überprüfen, entwerfen wir eine einfache, aber effektive Pipeline namens FocusCut, die die Funktionen der Objektsegmentierung und lokalen Verfeinerung integriert. Nach der Erzeugung der globalen Vorhersage extrahiert sie aus dem ursprünglichen Bild patchweise Regionen um die Klickpunkte herum, wobei die Ausdehnung adaptiv angepasst wird, um die lokalen Vorhersagen schrittweise zu verbessern. Ohne zusätzliche Benutzerinteraktion oder Erhöhung der Parameteranzahl erreicht unsere Methode Ergebnisse auf dem Stand der Technik. Umfangreiche Experimente und visuelle Ergebnisse zeigen, dass FocusCut eine hyperfeine Segmentierung für interaktive Bildsegmentierung ermöglicht.