Schwach beschriftete Instanzsegmentierung unter Verwendung des Beschränkungsrahmen-Schärfe-Priors

Diese Arbeit präsentiert eine schwach überwachte Instanzsegmentierungsmethode, die Trainingsdaten mit engen Bounding-Box-Annotationen verwendet. Die Hauptursache für die Schwierigkeit liegt in der ungewissen Figure-Ground-Trennung innerhalb jeder Bounding Box, da kein überwachender Signal dafür vorhanden ist. Wir lösen dieses Problem, indem wir das Problem als ein Multiple-Instance-Learning-(MIL-)Task formulieren und positive sowie negative Bags basierend auf Streifenlinien innerhalb jeder Bounding Box generieren. Das vorgeschlagene tiefes Modell integriert MIL in ein vollständig überwachtes Instanzsegmentierungsnetzwerk und kann durch ein Ziel-Funktional bestimmt werden, das aus zwei Termen besteht: dem Unary-Term und dem Pairwise-Term. Ersterer schätzt die Vordergrund- und Hintergrundbereiche jeder Bounding Box, während letzterer die Kohärenz der geschätzten Objektmasken gewährleistet. Die experimentellen Ergebnisse zeigen, dass unsere Methode gegenüber bestehenden schwach überwachten Methoden überzeugt und sogar einige vollständig überwachte Methoden für die Instanzsegmentierung auf dem PASCAL VOC-Datensatz übertreffen kann.