HyperAIHyperAI

Command Palette

Search for a command to run...

ARKit LabelMaker : Une nouvelle échelle pour la compréhension des scènes 3D intérieures

Guangda Ji Silvan Weder Francis Engelmann Marc Pollefeys Hermann Blum

Résumé

Les performances des réseaux de neurones s'améliorent en fonction de leur taille et de la quantité de données sur lesquelles ils ont été entraînés. Cela est démontré dans la génération de langage et d'images. Cependant, cela nécessite des architectures de réseau favorables à l'évolutivité ainsi que des jeux de données à grande échelle. Bien que des architectures favorables à l'évolutivité comme les transformers aient émergé pour les tâches de vision 3D, le moment GPT (GPT-moment) de la vision 3D reste encore éloigné en raison du manque de données d'entraînement. Dans cet article, nous présentons ARKit LabelMaker, le premier jeu de données 3D à grande échelle et issu du monde réel, doté d'annotations sémantiques denses. Plus précisément, nous complétons le jeu de données ARKitScenes avec des annotations sémantiques denses générées automatiquement à grande échelle. À cette fin, nous étendons LabelMaker, une récente pipeline d'annotation automatique, pour répondre aux besoins de l'entraînement préalable à grande échelle. Cela implique d'étendre la pipeline avec des modèles de segmentation à la pointe de la technologie et de la rendre robuste face aux défis du traitement à grande échelle. De plus, nous améliorons les performances actuelles sur les jeux de données ScanNet et ScanNet200 grâce aux modèles courants de segmentation sémantique 3D, démontrant ainsi l'efficacité de notre jeu de données généré.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
ARKit LabelMaker : Une nouvelle échelle pour la compréhension des scènes 3D intérieures | Articles | HyperAI