SPSN: Superpixel-Prototypen-Abtastnetzwerk für RGB-D-Salienzobjekterkennung

Die RGB-D-Salient-Object-Detection (SOD) steht aktuell im Fokus, da sie eine wichtige Vorverarbeitungsschritt für verschiedene visuelle Aufgaben darstellt. Trotz der Fortschritte bei tiefenlernenbasierten Methoden bleibt die RGB-D-SOD aufgrund des großen Domänenunterschieds zwischen einem RGB-Bild und der Tiefenkarte sowie aufgrund von niedriger Qualität der Tiefenkarten herausfordernd. Um dieses Problem zu lösen, schlagen wir eine neuartige Superpixel-Prototypen-Sampling-Netzwerkarchitektur (SPSN) vor. Das vorgeschlagene Modell unterteilt das Eingabebild und die Tiefenkarte in Komponentensuperpixel, um Komponentenprototypen zu generieren. Wir entwerfen ein Prototypensamplingnetzwerk, sodass das Netzwerk nur Prototypen von auffälligen Objekten sampelt. Darüber hinaus schlagen wir ein Verlässlichkeitsselektionsmodul vor, um die Qualität jeder RGB- und Tiefenfeaturekarte zu erkennen und diese proportional zu ihrer Zuverlässigkeit zu gewichten. Die vorgeschlagene Methode macht das Modell robust gegenüber Inkonsistenzen zwischen RGB-Bildern und Tiefenkarten und eliminiert den Einfluss nicht-auffälliger Objekte. Unsere Methode wird anhand von fünf gängigen Datensätzen evaluiert und erreicht dabei den Stand der Technik. Durch vergleichende Experimente beweisen wir die Effektivität der vorgeschlagenen Methode.