OPV2V: Ein offenes Benchmark-Datensatz- und Fusionssystem für die Wahrnehmung mit Fahrzeug-zu-Fahrzeug-Kommunikation

Die Nutzung von Fahrzeug-zu-Fahrzeug-Kommunikation zur Verbesserung der Wahrnehmungsleistung in der autonomen Fahrzeugtechnologie hat in letzter Zeit erhebliche Aufmerksamkeit erregt; dennoch erschwert das Fehlen eines geeigneten öffentlichen Datensatzes zur Benchmarking-Algorithmen die Entwicklung und Bewertung kooperativer Wahrnehmungstechnologien erheblich. Um diesem Problem entgegenzuwirken, präsentieren wir den ersten großskaligen, öffentlich verfügbaren simulierten Datensatz für Fahrzeug-zu-Fahrzeug-Wahrnehmung. Der Datensatz umfasst über 70 interessante Szenen, 11.464 Frames und 232.913 annotierte 3D-Bounding-Boxes von Fahrzeugen, die aus 8 Städten in CARLA sowie einer digitalen Nachbildung der Stadt Culver City, Los Angeles, gesammelt wurden. Anschließend erstellen wir eine umfassende Benchmark mit insgesamt 16 implementierten Modellen, um verschiedene Informationsfusionstrategien (nämlich frühe, späte und intermediäre Fusion) mit modernsten LiDAR-Detektionsalgorithmen zu evaluieren. Darüber hinaus schlagen wir einen neuen Ansatz namens „Attentive Intermediate Fusion“ vor, um Informationen aus mehreren miteinander verbundenen Fahrzeugen zu aggregieren. Unsere Experimente zeigen, dass der vorgeschlagene Pipeline-Ansatz problemlos mit bestehenden 3D-LiDAR-Detektoren integriert werden kann und selbst bei hohen Kompressionsraten herausragende Leistung erzielt. Um die Forschungsgemeinschaft zur weiteren Untersuchung der Fahrzeug-zu-Fahrzeug-Wahrnehmung zu ermutigen, werden wir den Datensatz, die Benchmark-Methoden sowie sämtlichen zugehörigen Quellcodes unter https://mobility-lab.seas.ucla.edu/opv2v/ veröffentlichen.