Ein allgemeiner Pipeline für die 3D-Erkennung von Fahrzeugen

Autonome Fahrzeuge erfordern eine dreidimensionale Wahrnehmung von Fahrzeugen und anderen Objekten in der Umgebung. Viele der aktuellen Methoden unterstützen lediglich die zweidimensionale Erkennung von Fahrzeugen. In dieser Arbeit wird ein flexibles Pipeline vorgeschlagen, das es ermöglicht, jedes 2D-Erkennungsnetzwerk zu verwenden und es mit einem 3D-Punktwolken-Datensatz zu fusionieren, um 3D-Informationen zu generieren, wobei die Anpassungen an den 2D-Erkennungsnetzwerken auf ein Minimum reduziert werden. Zur Identifizierung des 3D-Bounding-Box wurde ein effektiver Modellanpassungsalgorithmus entwickelt, der auf verallgemeinerten Fahrzeugmodellen und Scoremaps basiert. Ein zweistufiges Faltungsneuronales Netzwerk (CNN) wird vorgeschlagen, um die erkannten 3D-Bounding-Boxen zu verfeinern. Diese Pipeline wurde am KITTI-Datensatz unter Verwendung von zwei verschiedenen 2D-Erkennungsnetzwerken getestet. Die 3D-Ergebnisse basierend auf diesen beiden Netzwerken sind ähnlich, was die Flexibilität des vorgeschlagenen Pipelines zeigt. Die Ergebnisse rangieren auf dem zweiten Platz unter den 3D-Erkennungsalgorithmen, was deren Leistungsfähigkeit in der 3D-Erkennung unterstreicht.