Tiefes Bildmatting

Das Bild-Matting ist ein grundlegendes Problem der Computer Vision und hat zahlreiche Anwendungen. Vorherige Algorithmen zeigen eine schlechte Leistung, wenn ein Bild ähnliche Vorder- und Hintergrundfarben oder komplizierte Texturen aufweist. Die Hauptgründe sind, dass frühere Methoden 1) nur niederstufige Merkmale verwenden und 2) an hochstufigem Kontext mangeln. In dieser Arbeit schlagen wir einen neuen tiefen Lernalgorithmus vor, der beide Probleme bewältigen kann. Unser tiefes Modell besteht aus zwei Teilen. Der erste Teil ist ein tiefer Faltungsencoder-decoder-Netzwerk, das ein Bild und die entsprechende Trimap als Eingaben verwendet und das Alpha-Matte des Bildes vorhersagt. Der zweite Teil ist ein kleines Faltungsnetzwerk, das die Alpha-Matte-Vorhersagen des ersten Netzwerks verfeinert, um genauere Alpha-Werte und schärfere Kanten zu erzielen. Darüber hinaus haben wir auch einen groß angelegten Bild-Matting-Datensatz erstellt, der 49300 Trainingsbilder und 1000 Testbilder enthält. Wir evaluieren unseren Algorithmus anhand des Bild-Matting-Benchmarks, unseres Testsets und einer Vielzahl von realen Bildern. Die experimentellen Ergebnisse belegen deutlich die Überlegenheit unseres Algorithmus gegenüber den bisherigen Methoden.