HyperAIHyperAI
vor 2 Monaten

Tiefe interaktive Objektauswahl

Ning Xu; Brian Price; Scott Cohen; Jimei Yang; Thomas Huang
Tiefe interaktive Objektauswahl
Abstract

Die interaktive Objektauswahl ist ein sehr wichtiges Forschungsproblem und hat zahlreiche Anwendungen. Frühere Algorithmen erfordern erhebliche Benutzerinteraktionen, um die Vorder- und Hintergrundverteilungen zu schätzen. In dieser Arbeit präsentieren wir einen neuen tiefen Lernalgorithmus, der ein viel besseres Verständnis von Objektivität aufweist und daher die Benutzerinteraktionen auf wenige Klicks reduzieren kann. Unser Algorithmus transformiert die vom Benutzer bereitgestellten positiven und negativen Klicks in zwei euklidische Distanzkarten, die dann mit den RGB-Kanälen der Bilder kombiniert werden, um (Bild, Benutzerinteraktion) Paare zu erstellen. Wir generieren viele solcher Paare durch das Kombinieren mehrerer zufälliger Abtaststrategien, um Benutzerklickmuster zu modellieren, und verwenden sie zur Feinabstimmung tiefer fully convolutional Netzwerke (FCNs). Schließlich wird die Ausgabe der Wahrscheinlichkeitskarten unseres FCN 8s-Modells mit einer Graph-Cut-Optimierung integriert, um die Randsegmente zu verfeinern. Unser Modell wurde am PASCAL-Segmentierungsdatensatz trainiert und an anderen Datensätzen mit verschiedenen Objektklassen evaluiert. Experimentelle Ergebnisse sowohl an gesehenen als auch an ungesehenen Objekten zeigen deutlich, dass unser Algorithmus eine gute Generalisierungsfähigkeit besitzt und allen existierenden Ansätzen zur interaktiven Objektauswahl überlegen ist.

Tiefe interaktive Objektauswahl | Neueste Forschungsarbeiten | HyperAI