HyperAIHyperAI
vor 16 Tagen

DHSNet: Deep Hierarchical Saliency Network für die Erkennung auffälliger Objekte

{Junwei Han, Nian Liu}
DHSNet: Deep Hierarchical Saliency Network für die Erkennung auffälliger Objekte
Abstract

Traditionelle Modelle zur Erkennung auffälliger Objekte nutzen häufig handgefertigte Merkmale, um Kontrast und verschiedene Vorwissen zu formulieren, die anschließend künstlich kombiniert werden. In dieser Arbeit stellen wir ein neuartiges end-to-end tiefes hierarchisches Aufmerksamkeitsnetzwerk (DHSNet) basierend auf Faltungsneuralen Netzen vor, das zur Erkennung auffälliger Objekte eingesetzt wird. DHSNet erzeugt zunächst eine grobe globale Vorhersage, indem es automatisch verschiedene globale strukturierte Aufmerksamkeitsmerkmale lernt, darunter globaler Kontrast, Objektartigkeit, Kompaktheit sowie deren optimale Kombination. Anschließend wird ein neuartiges hierarchisches rekurrentes Faltungsneuronales Netzwerk (HRCNN) eingesetzt, um die Details der Aufmerksamkeitskarten schrittweise hierarchisch und progressiv durch Integration lokaler Kontextinformationen weiter zu verfeinern. Die gesamte Architektur arbeitet in einer global-zu-lokalen und grob-zu-fein-Weise. DHSNet wird direkt anhand vollständiger Bilder und entsprechender Ground-Truth-Aufmerksamkeitsmasken trainiert. Im Testbetrieb können Aufmerksamkeitskarten durch eine direkte und effiziente Vorwärtspropagation von Testbildern durch das Netzwerk generiert werden, ohne dass zusätzliche Techniken erforderlich sind. Evaluierungen an vier Benchmark-Datensätzen und Vergleiche mit anderen elf state-of-the-art-Algorithmen zeigen, dass DHSNet nicht nur eine signifikante Überlegenheit hinsichtlich der Leistung erzielt, sondern auch eine Echtzeitgeschwindigkeit von 23 FPS auf modernen GPUs erreicht.

DHSNet: Deep Hierarchical Saliency Network für die Erkennung auffälliger Objekte | Neueste Forschungsarbeiten | HyperAI