HyperAIHyperAI
vor 2 Monaten

Part-Level Convolutional Neural Networks für die Pedestrianderkennung unter Verwendung von Salienz und Boundbox-Ausrichtung

Inyong Yun; Cheolkon Jung; Xinran Wang; Alfred O Hero; Joongkyu Kim
Part-Level Convolutional Neural Networks für die Pedestrianderkennung unter Verwendung von Salienz und Boundbox-Ausrichtung
Abstract

Fußgänger in Videos zeigen eine breite Vielfalt an Erscheinungsformen, wie Körperhaltungen, Verdeckungen und komplexe Hintergründe. In der Fußgängererkennung besteht das Problem des Vorschlagschiebens (proposal shift), das zu Verlusten von Körperteilen wie Kopf und Beinen führt. Um dieses Problem anzugehen, schlagen wir in dieser Arbeit partbasierte Faltungsneuronale Netze (CNN) für die Fußgängererkennung vor, die Salienz und Bounding-Box-Ausrichtung nutzen. Das vorgeschlagene Netzwerk besteht aus zwei Unter-Netzwerken: Erkennung und Ausrichtung. In dem Erkennungsunternetzwerk verwenden wir Salienz, um Fehlalarme wie Laternenmasten und Bäume zu eliminieren. Im Ausrichtungsunternetzwerk wenden wir Bounding-Box-Ausrichtung auf die Erkennungsvorschläge an, um das Problem des Vorschlagschiebens zu lösen. Zunächst kombinieren wir FCN und CAM, um tiefe Merkmale für die Fußgängererkennung zu extrahieren. Anschließend führen wir partbasierte CNN durch, um die verlorenen Körperteile wiederherzustellen. Experimentelle Ergebnisse auf verschiedenen Datensätzen zeigen, dass die vorgeschlagene Methode die Genauigkeit der Fußgängererkennung erheblich verbessert und bestehende state-of-the-art-Methoden hinsichtlich des logarithmischen durchschnittlichen Fehlerrates pro Bild bei falschen Positiven (log average miss rate at false position per image, FPPI) übertrifft.

Part-Level Convolutional Neural Networks für die Pedestrianderkennung unter Verwendung von Salienz und Boundbox-Ausrichtung | Neueste Forschungsarbeiten | HyperAI