HyperAIHyperAI

Command Palette

Search for a command to run...

PolarNet : Nuages de Points 3D pour la Manipulation Robotique Guidée par le Langage

Shizhe Chen Ricardo Garcia Cordelia Schmid Ivan Laptev

Résumé

La capacité des robots à comprendre et à exécuter des tâches de manipulation basées sur des instructions en langage naturel est un objectif à long terme dans le domaine de la robotique. Les approches dominantes pour la manipulation guidée par le langage utilisent des représentations d'images 2D, qui rencontrent des difficultés pour combiner plusieurs caméras et inférer des positions et relations 3D précises. Pour remédier à ces limitations, nous proposons une politique basée sur les nuages de points 3D appelée PolarNet pour la manipulation guidée par le langage. Elle utilise des entrées de nuages de points soigneusement conçues, des encodeurs de nuages de points efficaces et des transformateurs multimodaux pour apprendre des représentations de nuages de points 3D et les intégrer avec des instructions linguistiques afin de prédire les actions. PolarNet s'est révélée efficace et peu gourmande en données dans diverses expériences menées sur le benchmark RLBench. Elle surpasses les méthodes 2D et 3D les plus avancées actuellement disponibles, tant en apprentissage mono-tâche qu'en apprentissage multi-tâches. Elle obtient également des résultats prometteurs sur un robot réel.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp