HyperAIHyperAI
il y a 2 mois

LION : Réseau de Neurones Récursifs Linéaire pour la Détection d'Objets 3D dans les Nuages de Points

Zhe Liu; Jinghua Hou; Xinyu Wang; Xiaoqing Ye; Jingdong Wang; Hengshuang Zhao; Xiang Bai
LION : Réseau de Neurones Récursifs Linéaire pour la Détection d'Objets 3D dans les Nuages de Points
Résumé

Les avantages des transformateurs dans les tâches de perception à grande échelle de nuages de points 3D, telles que la détection d'objets 3D, sont limités par leur coût de calcul quadratique lorsqu'ils modélisent des relations à longue portée. En revanche, les RNN linéaires présentent une faible complexité de calcul et sont adaptées pour la modélisation à longue portée. Dans cette optique, nous proposons un cadre simple et efficace basé sur des fenêtres, construit sur LInear grOup RNN (c'est-à-dire en effectuant un RNN linéaire pour des caractéristiques regroupées), pour une détection précise d'objets 3D, appelé LION. La propriété clé est de permettre une interaction suffisante des caractéristiques dans un groupe beaucoup plus grand que les méthodes basées sur les transformateurs. Cependant, l'application efficace du RNN linéaire par groupes à la détection d'objets 3D dans des nuages de points très épars n'est pas triviale en raison de sa limitation dans le traitement du modèle spatial. Pour résoudre ce problème, nous introduisons simplement un descripteur de caractéristiques spatiales 3D et l'intégrons aux opérateurs RNN linéaires par groupes afin d'améliorer leurs caractéristiques spatiales plutôt que d'augmenter aveuglément le nombre d'ordres de balayage pour les caractéristiques voxel. Pour faire face au défi posé par les nuages de points très épars, nous proposons également une stratégie de génération de voxels 3D pour densifier les caractéristiques du premier plan grâce à la nature intrinsèque des modèles auto-régressifs du RNN linéaire par groupes. De nombreux expériences confirment l'efficacité des composants proposés et la généralisation de notre LION sur différents opérateurs RNN linéaires par groupes, y compris Mamba, RWKV et RetNet. Il convient également de mentionner que notre LION-Mamba atteint l'état de l'art sur les jeux de données Waymo, nuScenes, Argoverse V2 et ONCE. Enfin, notre méthode prend en charge divers opérateurs avancés RNN linéaires (par exemple : RetNet, RWKV, Mamba, xLSTM et TTT) sur le jeu de données KITTI populaire mais petit, offrant ainsi une expérience rapide avec notre cadre basé sur le RNN linéaire.

LION : Réseau de Neurones Récursifs Linéaire pour la Détection d'Objets 3D dans les Nuages de Points | Articles de recherche récents | HyperAI