HyperAIHyperAI
vor 2 Monaten

Ein tieferer Blick auf Fußgänger

Jan Hosang; Mohamed Omran; Rodrigo Benenson; Bernt Schiele
Ein tieferer Blick auf Fußgänger
Abstract

In dieser Arbeit untersuchen wir die Anwendung von Faltungsneuronalen Netzen (ConvNets) für die Aufgabe der Fußgängererkennung. Trotz ihrer vielfältigen jüngsten Erfolge unterperformen ConvNets historisch gesehen im Vergleich zu anderen Fußgängerdetektoren. Wir lassen bewusst eine explizite Modellierung des Problems in das Netzwerk (z.B. Teile- oder Verdeckungsmodellierung) weg und zeigen, dass wir wettbewerbsfähige Leistungen ohne zusätzliche Verfeinerungen erzielen können. In einer breiten Palette von Experimenten analysieren wir kleine und große ConvNets, ihre architektonischen Entscheidungen, Parameter und den Einfluss verschiedener Trainingsdaten, einschließlich des Vortrainings auf Stellvertreteraufgaben.Wir präsentieren die besten ConvNet-Detektoren für den Caltech- und KITTI-Datensatz. Bei Caltech erreichen unsere ConvNets Spitzenleistungen sowohl für die Caltech1x- als auch für die Caltech10x-Trainingskonfiguration. Durch die Nutzung zusätzlicher Daten während der Trainingsphase ist unser stärkstes ConvNet-Modell sogar wettbewerbsfähig gegenüber Detektoren, die bei der Testphase zusätzliche Daten (optischer Fluss) verwenden.

Ein tieferer Blick auf Fußgänger | Neueste Forschungsarbeiten | HyperAI