Verkehrssteuerungs-Gesten-Erkennung für autonome Fahrzeuge

Ein Fahrer kennt sich mit den Gesten von Verkehrsbeauftragten aus. Offensichtlich gilt dies nicht für autonome Fahrzeuge, es sei denn, sie verfügen über Funktionen zur Erkennung von Verkehrssteuerungsgesten. In dieser Arbeit behandeln wir die Einschränkung bestehender Datensätze für autonome Fahrzeuge, die als Lernmaterial für die Erkennung von Verkehrssteuerungsgesten dienen sollen. Wir stellen ein Datenset vor, das auf 3D-Körperskelett-Eingaben basiert und die Klassifizierung von Verkehrssteuerungsgesten in jedem Zeitpunkt ermöglicht. Unser Datenset umfasst 250 Sequenzen mehrerer Akteure, wobei die Länge der einzelnen Sequenzen zwischen 16 und 90 Sekunden variiert. Zur Bewertung unseres Datensets schlagen wir acht sequenzielle Verarbeitungsmodelle vor, die auf tiefen neuronalen Netzen basieren, darunter rekurrente Netzwerke, Aufmerksamkeitsmechanismen, zeitliche Faltungsnetzwerke und Graph-Faltungsnetzwerke. Wir präsentieren eine umfassende Evaluation und Analyse aller Ansätze für unser Datenset sowie eine quantitative Bewertung im realen Einsatz. Der Quellcode und das Datenset sind öffentlich verfügbar.