HyperAIHyperAI

Command Palette

Search for a command to run...

三维视觉定位

3D visual grounding是计算机视觉领域的一项关键技术,旨在通过自然语言描述在三维环境中精确定位和识别目标对象。该技术结合了图像理解和自然语言处理,能够实现从文本到具体3D场景中物体的映射,具有广泛的应用价值,如增强现实、机器人导航和智能交互等。

暂无数据
该任务下暂无可用的基准测试数据