HyperAIHyperAI
il y a 2 mois

Segmentation Panoptique 4D comme Prédiction de Champs Invariants et Équivariants

Zhu, Minghan ; Han, Shizhong ; Cai, Hong ; Borse, Shubhankar ; Ghaffari, Maani ; Porikli, Fatih
Segmentation Panoptique 4D comme Prédiction de Champs Invariants et Équivariants
Résumé

Dans cet article, nous développons des réseaux de neurones équivariants aux rotations pour la segmentation panoptique 4D. La segmentation panoptique 4D est une tâche de référence dans le domaine de la conduite autonome, qui nécessite de reconnaître les classes sémantiques et les instances d'objets sur la route à partir de balayages LiDAR, ainsi que d'attribuer des identifiants (IDs) temporellement cohérents aux instances au fil du temps. Nous constatons que le scénario de conduite est symétrique aux rotations sur le plan du sol. Par conséquent, l'équivariance aux rotations pourrait offrir une meilleure généralisation et un apprentissage plus robuste des caractéristiques.Plus précisément, nous examinons les stratégies de regroupement des instances d'objets et reformulons l'approche basée sur le centrage et l'approche basée sur le décalage comme la prédiction de champs scalaires invariants et de champs vectoriels équivariants. D'autres sous-tâches sont également unifiées selon cette perspective, et différentes couches invariantes et équivariantes sont conçues pour faciliter leurs prédictions. Grâce à l'évaluation sur le benchmark standard de segmentation panoptique 4D de SemanticKITTI, nous montrons que nos modèles équivariants atteignent une précision supérieure avec des coûts computationnels inférieurs par rapport à leurs homologues non équivariants.De plus, notre méthode établit un nouveau niveau de performance inégalée et occupe la première place du classement SemanticKITTI pour la segmentation panoptique 4D.

Segmentation Panoptique 4D comme Prédiction de Champs Invariants et Équivariants | Articles de recherche récents | HyperAI