Eine hierarchische Tiefenarchitektur und eine Minibatch-Auswahlmethode für die gemeinsame Erkennung von Verkehrszeichen und Lichtsignalen

Verkehrssignal- und Schilderkennungssysteme sind für die Wahrnehmung von Straßenbildern in autonomen Fahrzeugen unerlässlich. Die Literatur bietet zahlreiche tiefe Lernalgorithmen, die entweder Verkehrssignale oder -schilder erkennen, aber nicht beide, was sie aufgrund der begrenzten Grafikprozessor- (GPU-) Speicher- und Leistungsfähigkeit in eingebetteten Systemen für den praktischen Einsatz ungeeignet macht. Das Kernproblem liegt darin, dass es keine öffentliche Datensätze gibt, die sowohl Verkehrssignal- als auch Schilderlabels enthalten, was die Entwicklung eines gemeinsamen Erkennungsframeworks erschwert. Wir präsentieren eine tief hierarchische Architektur in Kombination mit einem Minibatch-Vorschlagsauswahlmechanismus, der es ermöglicht, sowohl Verkehrssignale als auch -schilder durch das Training auf getrennten Datensätzen für Verkehrssignale und -schilder zu erkennen. Unsere Methode löst das Überlappungsproblem, bei dem Instanzen aus einem Datensatz im anderen Datensatz nicht beschriftet sind. Wir sind die ersten, die ein Netzwerk vorstellen, das eine gemeinsame Erkennung von Verkehrssignalen und -schildern durchführt. Wir evaluieren unser Netzwerk anhand des Tsinghua-Tencent 100K-Benchmarks für die Erkennung von Verkehrsschildern und des Bosch Small Traffic Lights-Benchmarks für die Erkennung von Verkehrssignalen und zeigen, dass es die bestehende Bosch Small Traffic Light State-of-the-Art-Methode übertrifft. Unser Fokus liegt auf der Implementierung in autonomen Fahrzeugen, und wir demonstrieren, dass unser Netzwerk aufgrund seines geringen Speicherverbrauchs und seiner Echtzeitbildverarbeitungszeit besser geeignet ist als andere Methoden. Qualitative Ergebnisse können unter https://youtu.be/_YmogPzBXOw eingesehen werden.