Multiklassen-Verkehrsnehmer-Detektion mit 3+1D-Radar im View-of-Delft-Datensatz
Nächste Generationen von Fahrzeugradaren liefern neben Informationen zu Entfernung, Azimut und Doppler-Geschwindigkeit auch Höheninformationen. In dieser experimentellen Studie wenden wir einen state-of-the-art-Objektdetektor (PointPillars), der ursprünglich für LiDAR-3D-Daten entwickelt wurde, auf solche 3+1D-Radar-Daten an (wobei die 1D die Doppler-Auswertung bezeichnet). In Ablationsstudien untersuchen wir zunächst die Vorteile der zusätzlichen Höheninformation sowie der Doppler-Daten, des Radarquerschnitts und der zeitlichen Akkumulation im Kontext der Mehrklassen-Erkennung von Verkehrsteilnehmern. Anschließend vergleichen wir die Objektdetektionsleistung auf Radar- und LiDAR-Punktwolken, getrennt nach Objektklassen und in Abhängigkeit von der Entfernung. Um unsere experimentelle Studie zu unterstützen, stellen wir den neuartigen View-of-Delft (VoD)-Datenbestand für Fahrzeuganwendungen vor. Er enthält 8693 Frames synchronisierter und kalibrierter Daten aus einem 64-schichtigen LiDAR, (Stereo-)Kameras und 3+1D-Radar-Daten, die in komplexen, städtischen Verkehrsbedingungen erfasst wurden. Der Datensatz umfasst insgesamt 123.106 3D-Bounding-Box-Anmerkungen für sowohl bewegliche als auch statische Objekte, darunter 26.587 Fußgänger-, 10.800 Radfahrer- und 26.949 Automobil-Bezeichnungen. Unsere Ergebnisse zeigen, dass die Objektdetektion auf 64-schichtigen LiDAR-Daten weiterhin die Leistung auf 3+1D-Radar-Daten übertrifft, jedoch die Hinzunahme von Höheninformationen sowie die Integration aufeinanderfolgender Radar-Szenen dazu beitragen, die Leistungs-Lücke zu schließen. Der VoD-Datensatz steht frei für wissenschaftliche Benchmarking-Zwecke unter https://intelligent-vehicles.org/datasets/view-of-delft/ zur Verfügung.