ICP-Flow : Estimation du flux de scène LiDAR avec ICP

Le flux de scène caractérise le mouvement 3D entre deux balayages LiDAR capturés par un véhicule autonome à des instants de temps proches. Les méthodes courantes considèrent le flux de scène comme des vecteurs de déplacement non contraints au niveau des points, qui peuvent être appris soit par une formation à grande échelle préalablement, soit par une optimisation coûteuse en temps lors de l'inférence. Cependant, ces méthodes ne prennent pas en compte que les objets dans la conduite autonome se déplacent souvent rigide-ment. Nous intégrons cette hypothèse de mouvement rigide dans notre conception, où l'objectif est d'associer les objets entre les balayages et d'estimer ensuite les transformations rigides locales. Nous proposons ICP-Flow, un estimateur de flux sans apprentissage. Le cœur de notre conception est l'algorithme conventionnel Iterative Closest Point (ICP), qui aligne les objets dans le temps et fournit les transformations rigides correspondantes. De manière cruciale, pour aider l'ICP, nous proposons une initialisation basée sur des histogrammes qui découvre la traduction la plus probable, offrant ainsi un bon point de départ pour l'ICP. Le flux de scène complet est ensuite récupéré à partir des transformations rigides. Nous surpassons les modèles baselines de pointe, y compris ceux supervisés, sur le jeu de données Waymo et obtenons des performances compétitives sur Argoverse-v2 et nuScenes. De plus, nous formons un réseau neuronal feedforward supervisé par les étiquettes pseudo générées par notre modèle et atteignons des performances supérieures parmi tous les modèles capables d'inférence en temps réel. Nous validons l'avantage de notre modèle pour l'estimation du flux de scène avec des écarts temporels plus longs, jusqu'à 0,4 seconde où d'autres modèles échouent à fournir des résultats significatifs.