Navigation visuelle et linguistique
La Navigation Vision et Langage (V&L Navigation) est une tâche qui intègre les technologies de vision par ordinateur et de traitement du langage naturel, visant à permettre aux robots d'atteindre une navigation autonome en comprenant les instructions linguistiques humaines et les informations visuelles de l'environnement dans des environnements complexes. L'objectif de cette tâche est d'améliorer les capacités de perception environnementale des robots et leur flexibilité d'interaction, leur permettant de terminer les tâches de navigation de manière plus efficace dans divers scénarios d'application tels que les services domestiques, les soins médicaux et l'automatisation industrielle, ce qui améliore l'expérience utilisateur et la sécurité opérationnelle.