HyperAI

Vision and Language Navigation (V&L-Navigation) ist eine Aufgabe, die Technologien der Computer Vision und der natürlichen Sprachverarbeitung kombiniert. Das Ziel besteht darin, Roboter zu befähigen, durch das Verstehen menschlicher Sprachanweisungen und visueller Umgebungsinformationen in komplexen Umgebungen autonom zu navigieren. Diese Aufgabe soll die Umgebungserkennungsfähigkeiten und die Interaktionsflexibilität des Roboters verbessern, um seine Effizienz bei Navigationsaufgaben in verschiedenen Anwendungsszenarien wie Haushaltsdienstleistungen, medizinische Pflege und industrielle Automatisierung zu steigern. Dadurch wird sowohl die Benutzererfahrung als auch die Betriebssicherheit erhöht.

VLN Challenge

Touchdown Dataset

Hierarchical Cross-Modal Agent