HyperAIHyperAI
vor 2 Monaten

Ein einfaches poolungsbasiertes Design für die Echtzeit-Erkennung von auffälligen Objekten

Jiang-Jiang Liu; Qibin Hou; Ming-Ming Cheng; Jiashi Feng; Jianmin Jiang
Ein einfaches poolungsbasiertes Design für die Echtzeit-Erkennung von auffälligen Objekten
Abstract

Wir lösen das Problem der detektion von auffälligen Objekten, indem wir untersuchen, wie die Rolle des Poolings in konvolutionellen neuronalen Netzen erweitert werden kann. Basierend auf der U-förmigen Architektur bauen wir zunächst ein globales Leitungsmodul (Globales Guidance Modul, GGM) über den bottom-up Pfad, mit dem Ziel, den Schichten auf verschiedenen Merkmalsniveaus die Positionsinformation potentiell auffälliger Objekte zu liefern. Wir entwerfen ferner ein Merkmalsaggregationsmodul (Feature Aggregation Modul, FAM), um die grobe semantische Information gut mit den feinen Merkmalen aus dem top-down Pfad zu verschmelzen. Durch Hinzufügen von FAMs nach den Fusionoperationen im top-down Pfad können die groben Merkmale des GGM nahtlos mit Merkmalen verschiedener Skalen kombiniert werden. Diese beiden pooling-basierten Module ermöglichen es, dass hochwertige sematische Merkmale schrittweise verfeinert werden und detailreiche Salienzkarten erzeugt werden. Experimentelle Ergebnisse zeigen, dass unser vorgeschlagener Ansatz die auffälligen Objekte genauer lokalisieren kann und dabei verschärfte Details liefert, was eine erhebliche Verbesserung der Leistung im Vergleich zu bisherigen Stand der Technik darstellt. Unser Ansatz ist zudem schnell und kann bei der Verarbeitung eines Bildes mit einer Auflösung von $300 \times 400$ Pixeln eine Geschwindigkeit von mehr als 30 FPS erreichen. Der Quellcode ist unter http://mmcheng.net/poolnet/ verfügbar.

Ein einfaches poolungsbasiertes Design für die Echtzeit-Erkennung von auffälligen Objekten | Neueste Forschungsarbeiten | HyperAI