HyperAIHyperAI

Command Palette

Search for a command to run...

LION : Réseau de Neurones Récursifs Linéaire pour la Détection d'Objets 3D dans les Nuages de Points

Zhe Liu Jinghua Hou Xinyu Wang Xiaoqing Ye Jingdong Wang Hengshuang Zhao Xiang Bai

Résumé

Les avantages des transformateurs dans les tâches de perception à grande échelle de nuages de points 3D, telles que la détection d'objets 3D, sont limités par leur coût de calcul quadratique lorsqu'ils modélisent des relations à longue portée. En revanche, les RNN linéaires présentent une faible complexité de calcul et sont adaptées pour la modélisation à longue portée. Dans cette optique, nous proposons un cadre simple et efficace basé sur des fenêtres, construit sur LInear grOup RNN (c'est-à-dire en effectuant un RNN linéaire pour des caractéristiques regroupées), pour une détection précise d'objets 3D, appelé LION. La propriété clé est de permettre une interaction suffisante des caractéristiques dans un groupe beaucoup plus grand que les méthodes basées sur les transformateurs. Cependant, l'application efficace du RNN linéaire par groupes à la détection d'objets 3D dans des nuages de points très épars n'est pas triviale en raison de sa limitation dans le traitement du modèle spatial. Pour résoudre ce problème, nous introduisons simplement un descripteur de caractéristiques spatiales 3D et l'intégrons aux opérateurs RNN linéaires par groupes afin d'améliorer leurs caractéristiques spatiales plutôt que d'augmenter aveuglément le nombre d'ordres de balayage pour les caractéristiques voxel. Pour faire face au défi posé par les nuages de points très épars, nous proposons également une stratégie de génération de voxels 3D pour densifier les caractéristiques du premier plan grâce à la nature intrinsèque des modèles auto-régressifs du RNN linéaire par groupes. De nombreux expériences confirment l'efficacité des composants proposés et la généralisation de notre LION sur différents opérateurs RNN linéaires par groupes, y compris Mamba, RWKV et RetNet. Il convient également de mentionner que notre LION-Mamba atteint l'état de l'art sur les jeux de données Waymo, nuScenes, Argoverse V2 et ONCE. Enfin, notre méthode prend en charge divers opérateurs avancés RNN linéaires (par exemple : RetNet, RWKV, Mamba, xLSTM et TTT) sur le jeu de données KITTI populaire mais petit, offrant ainsi une expérience rapide avec notre cadre basé sur le RNN linéaire.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp