HyperAIHyperAI
vor 17 Tagen

Ein stufenweises Verbesserungsmodell zur Erkennung auffälliger Objekte in Bildern

{Pingping Zhang, Ali Borji, Tiantian Wang, Lihe Zhang, Huchuan Lu}
Ein stufenweises Verbesserungsmodell zur Erkennung auffälliger Objekte in Bildern
Abstract

Tiefgehende konvolutionelle neuronale Netze (CNNs) wurden erfolgreich auf eine Vielzahl von Aufgaben im Bereich des Computersehens angewendet, darunter auch die Detektion auffälliger Objekte. Um auffällige Objekte präzise zu detektieren und zu segmentieren, ist es notwendig, gleichzeitig hochwertige semantische Merkmale mit niedrigstufigen feinen Details zu extrahieren und zu kombinieren. Dies stellt jedoch eine Herausforderung für CNNs dar, da wiederholte Unterteilungsoperationen wie Pooling und Faltung zu einer erheblichen Reduktion der ursprünglichen Bildauflösung führen, was wiederum einen Verlust an räumlichen Details und feiner Strukturen zur Folge hat. Um dieses Problem zu beheben, schlagen wir hier eine Erweiterung von Feedforward-Netzen durch ein neuartiges Pyramiden-Pooling-Modul und einen mehrstufigen Nachbearbeitungsmechanismus zur Sichtbarkeitsdetektion vor. Zunächst wird unser tiefes Feedforward-Netz verwendet, um eine grobe Vorhersagemap zu erzeugen, bei der viele strukturelle Details verloren gegangen sind. Anschließend werden Nachbearbeitungsnetze mit lokalen Kontextinformationen integriert, um die zuvor im Hauptzweig generierten Sichtbarkeitskarten schrittweise zu verfeinern. Darüber hinaus wird ein Pyramiden-Pooling-Modul eingesetzt, um globale Kontextinformationen basierend auf unterschiedlichen Regionen zu aggregieren. Empirische Evaluierungen an fünf Benchmark-Datensätzen zeigen, dass unsere vorgeschlagene Methode im Vergleich zu aktuellen State-of-the-Art-Ansätzen überzeugt.

Ein stufenweises Verbesserungsmodell zur Erkennung auffälliger Objekte in Bildern | Neueste Forschungsarbeiten | HyperAI