Dicht deformierbares effizientes Netzwerk zur Detektion von auffälligen Objekten

Der Bereich der Salient Object Detection (SOD) mit RGB-D-Daten ist kürzlich mit einigen aktuellen Modellen, die hinreichend präzise Ergebnisse liefern, in den Vordergrund gerückt. Allerdings weisen diese Modelle eingeschränkte Generalisierungsfähigkeiten und eine hohe rechnerische Komplexität auf. In dieser Arbeit nutzen wir die besten Fähigkeiten zur Trennung von Hinter- und Vordergrund durch deformierbare Faltungen, um sie in unserem Densely Deformable Network (DDNet) einzusetzen und so eine effiziente SOD zu erreichen. Die auffälligen Bereiche aus den dicht deformierbaren Faltungen werden anschließend durch transponierte Faltungen weiter verfeinert, um die Salienzkarten optimal zu generieren. Quantitative und qualitative Bewertungen unter Verwendung des neuesten SOD-Datensatzes im Vergleich zu 22 konkurrierenden Techniken zeigen die Effizienz und Wirksamkeit unserer Methode. Zudem bieten wir eine Bewertung mit einem von uns selbst erstellten Querdatensatz, dem Surveillance-SOD (S-SOD), an, um die Gültigkeit der trainierten Modelle hinsichtlich ihrer Anwendbarkeit in verschiedenen Szenarien zu überprüfen. Die Ergebnisse deuten darauf hin, dass die aktuellen Modelle begrenzte Generalisierungspotentiale haben und weitere Forschung in diese Richtung erforderlich ist. Unser Code und der neue Datensatz werden öffentlich verfügbar sein unter https://github.com/tanveer-hussain/EfficientSOD.