SeFlow : Une Méthode de Flot Scénique Auto-Supervisée dans la Conduite Autonome

L'estimation du flux de scène prédit le mouvement 3D à chaque point dans les balayages LiDAR successifs. Ces informations détaillées, au niveau des points, peuvent aider les véhicules autonomes à prédire et comprendre avec précision les changements dynamiques de leur environnement. Les méthodes actuelles de pointe nécessitent des données annotées pour entraîner les réseaux d'estimation du flux de scène, et le coût inhérent à l'étiquetage limite naturellement leur évolutivité. Les approches auto-supervisées peuvent surmonter ces limitations, mais elles font face à deux défis principaux qui entravent leurs performances optimales : l'imbalance de la distribution des points et le manque de prise en compte des contraintes de mouvement au niveau des objets. Dans cet article, nous proposons SeFlow, une méthode auto-supervisée qui intègre une classification dynamique efficace dans un pipeline d'estimation du flux de scène basé sur l'apprentissage. Nous montrons que la classification des points statiques et dynamiques aide à concevoir des fonctions objectif ciblées pour différents modèles de mouvement. Nous soulignons également l'importance de la cohérence interne des clusters et d'une association correcte des points d'objet pour affiner l'estimation du flux de scène, en particulier sur les détails des objets. Notre méthode capable de fonctionner en temps réel atteint des performances de pointe dans la tâche d'estimation du flux de scène auto-supervisée sur les jeux de données Argoverse 2 et Waymo. Le code est open-source et disponible à l'adresse https://github.com/KTH-RPL/SeFlow, accompagné des poids du modèle entraîné.