SeFlow: Eine selbstüberwachte Scene-Flow-Methode im autonomen Fahren

Die Szene-Fluss-Schätzung (scene flow estimation) prognostiziert die 3D-Bewegung an jedem Punkt in aufeinanderfolgenden LiDAR-Scans. Diese detaillierten, punktbezogenen Informationen können autonom fahrenden Fahrzeugen helfen, dynamische Veränderungen in ihrer Umgebung genauer vorherzusagen und zu verstehen. Aktuelle Methoden erster Güte (state-of-the-art methods) benötigen annotierte Daten zum Trainieren von Szene-Fluss-Netzwerken, wobei die Kosten für das Labeling ihre Skalierbarkeit inhärent einschränken. Selbstüberwachte Ansätze können diese Einschränkungen überwinden, jedoch stehen ihnen zwei wesentliche Herausforderungen im Weg, die eine optimale Leistung verhindern: Ungleichgewichtige Punkteverteilung und Vernachlässigung von objektbasierten Bewegungsrestriktionen. In dieser Arbeit schlagen wir SeFlow vor, eine selbstüberwachte Methode, die effiziente dynamische Klassifizierung in einen lernbasierten Szene-Fluss-Pipeline integriert. Wir zeigen, dass die Klassifizierung statischer und dynamischer Punkte hilfreich ist, um gezielte Zielfunktionen für verschiedene Bewegungsmuster zu entwerfen. Wir betonen auch die Bedeutung der internen Clusterkonsistenz und der korrekten Zuordnung von Objektpunkten zur Verfeinerung der Szene-Fluss-Schätzung, insbesondere bei den Details von Objekten. Unsere Echtzeitfähige Methode erreicht Spitzenleistungen (state-of-the-art performance) bei der selbstüberwachten Szene-Fluss-Aufgabe auf den Datensätzen Argoverse 2 und Waymo. Der Quellcode wird unter https://github.com/KTH-RPL/SeFlow zusammen mit den trainierten Modellgewichten offen veröffentlicht.