HyperAIHyperAI
vor 2 Monaten

Ein vereintes mehrskaliges tiefes Faltungsneuronales Netzwerk für schnelle Objekterkennung

Cai, Zhaowei ; Fan, Quanfu ; Feris, Rogerio S. ; Vasconcelos, Nuno
Ein vereintes mehrskaliges tiefes Faltungsneuronales Netzwerk für schnelle Objekterkennung
Abstract

Ein einheitliches tiefes neuronales Netzwerk, das als Multi-Skalen-CNN (MS-CNN) bezeichnet wird, wird vorgeschlagen, um eine schnelle Multi-Skalen-Objekterkennung durchzuführen. Das MS-CNN besteht aus einem Vorschlag-Unternetzwerk und einem Erkennungs-Unternetzwerk. Im Vorschlag-Unternetzwerk wird die Erkennung auf mehreren Ausgabeschichten durchgeführt, sodass die Rezeptivfelder Objekten verschiedener Größen entsprechen. Diese ergänzenden skalenabhängigen Detektoren werden kombiniert, um einen leistungsfähigen Multi-Skalen-Objektdetektor zu erzeugen. Das einheitliche Netzwerk wird von Anfang bis Ende gelernt, indem ein Mehraufgabenverlust optimiert wird. Es wird auch die Merkmalsaufsampling durch Deconvolution untersucht, als Alternative zum Eingangsaufsampling, um die Speicher- und Rechenaufwendungen zu reduzieren. Auf Datensätzen wie KITTI und Caltech, die eine beträchtliche Anzahl kleiner Objekte enthalten, wird eine erstklassige Objekterkennungsleistung von bis zu 15 Bildern pro Sekunde (fps) gemeldet.

Ein vereintes mehrskaliges tiefes Faltungsneuronales Netzwerk für schnelle Objekterkennung | Neueste Forschungsarbeiten | HyperAI