HyperAIHyperAI

Command Palette

Search for a command to run...

SVT-Net : Super léger Sparse Voxel Transformer pour la reconnaissance de lieux à grande échelle

Zhaoxin Fan Zhenbo Song Hongyan Liu* Zhiwu Lu Jun He* Xiaoyong Du

Résumé

La reconnaissance de lieux à grande échelle basée sur des nuages de points est fondamentale pour de nombreuses applications telles que la Localisation et Cartographie Simultanées (SLAM). Bien que de nombreux modèles aient été proposés et aient obtenu d'excellents résultats en apprenant des caractéristiques locales à courte portée, les propriétés contextuelles à longue portée ont souvent été négligées. De plus, la taille des modèles est également devenue une bouteille d'encolure pour leurs applications généralisées. Pour surmonter ces défis, nous proposons un modèle de réseau ultra-léger nommé SVT-Net pour la reconnaissance de lieux à grande échelle. Plus précisément, en s'appuyant sur la convolution éparsse 3D (SP-Conv) hautement efficace, un Transformateur Voxel Épars Atomique (ASVT) et un Transformateur Voxel Épars Basé sur les Clusters (CSVT) sont proposés afin d'apprendre à la fois des caractéristiques locales à courte portée et des caractéristiques contextuelles à longue portée dans ce modèle. Composé d'ASVT et CSVT, SVT-Net peut atteindre l'état de l'art sur les jeux de données de référence en termes de précision et de vitesse avec une taille de modèle ultra-légère (0,9M). Parallèlement, deux versions simplifiées de SVT-Net sont introduites, qui atteignent également l'état de l'art tout en réduisant davantage la taille du modèle respectivement à 0,8M et 0,4M.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
SVT-Net : Super léger Sparse Voxel Transformer pour la reconnaissance de lieux à grande échelle | Articles | HyperAI