HyperAIHyperAI

Command Palette

Search for a command to run...

VNLA

视觉导航与语言理解(VNLA)是计算机视觉领域的子任务,旨在通过请求和执行语言子目标,在高度逼真的环境中定位和识别对象。该任务结合了自然语言处理和视觉感知技术,使机器能够理解复杂的语言指令,并在动态环境中准确执行导航和对象搜索任务,具有广泛的应用前景,如智能机器人、虚拟助手和增强现实系统。

暂无数据
该任务下暂无可用的基准测试数据