HyperAIHyperAI

Command Palette

Search for a command to run...

Bildbasierte Navigation mit sprachbasierter Unterstützung

Vision-basierte Navigation mit sprachlicher Unterstützung ist eine Aufgabe, die visuelle Wahrnehmung und sprachliche Anleitung kombiniert. Das Ziel ist es, einen Agenten durch hochwertige sprachliche Ziele in realistischen Innenräumen zu einem bestimmten Objekt zu navigieren. Diese Aufgabe simuliert reale Szenarien, in denen der Anforderer nur hohebene Ziele angibt und der Agente aktiv einen erfahrenen Berater nach konkreten sprachlichen Teilzielen befragen kann, wenn er sich verirrt. Diese Technologie hat erheblichen Anwendungswert, um die Autonomie und interaktiven Fähigkeiten von Robotern zu verbessern.

Keine Daten
Keine Benchmark-Daten für diese Aufgabe verfügbar
Bildbasierte Navigation mit sprachbasierter Unterstützung | SOTA | HyperAI