Command Palette
Search for a command to run...
Modèle d'action Du Langage Visuel (VLA)
Date
Vision-Langage-Action (VLA) est un système intelligent multimodal qui intègre profondément la perception visuelle, la compréhension du langage et le contrôle des mouvements du robot.
L'alignement visuel (VLA) génère des séquences d'actions exécutables ou des stratégies de contrôle pour les robots directement à partir d'entrées visuelles et de commandes en langage naturel, grâce à un apprentissage de bout en bout. Son principal atout réside dans ses puissantes capacités de compréhension et de généralisation des scènes, permettant aux robots d'accomplir des tâches avec des commandes ouvertes dans des environnements réels complexes et dynamiques, tels que les services à domicile et les opérations industrielles. Il constitue une voie essentielle vers l'avènement d'une intelligence incarnée générale.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.