DeFlow : Décodage du Réseau de Flot Scénique dans la Conduite Autonome

L'estimation du flux de scène détermine le champ de mouvement 3D d'une scène en prédissant le mouvement des points dans cette scène, notamment pour aider les tâches liées à la conduite autonome. De nombreux réseaux utilisant des nuages de points de grande échelle comme entrée recourent à la voxelisation pour créer une pseudo-image permettant une exécution en temps réel. Cependant, le processus de voxelisation entraîne souvent une perte des caractéristiques spécifiques aux points. Ceci pose un défi pour la récupération de ces caractéristiques dans les tâches d'estimation du flux de scène. Notre article présente DeFlow, qui permet une transition des caractéristiques basées sur les voxels vers des caractéristiques de points grâce à l'affinement par unités récurrentes à portes (Gated Recurrent Unit - GRU). Pour améliorer encore davantage les performances d'estimation du flux de scène, nous formulons une nouvelle fonction de perte qui prend en compte l'imbalance des données entre les points statiques et dynamiques. Les évaluations sur la tâche d'estimation du flux de scène Argoverse 2 montrent que DeFlow obtient des résultats d'état de l'art sur des données de nuages de points de grande échelle, démontrant que notre réseau offre des performances et une efficacité supérieures par rapport aux autres. Le code est open-source et disponible sur https://github.com/KTH-RPL/deflow.