Command Palette

Search for a command to run...

OmniSpatial 全景空间推理基准数据集

日期

1 个月前

大小

9.45 GB

机构

Shanghai Qi Zhi Institute(上海期智研究院)
Tsinghua University
上海人工智能实验室

论文链接

2506.03135

许可协议

Apache 2.0

OmniSpatial 是由清华大学联合上海期智研究院、上海人工智能实验室等机构于 2025 年发布的一个全景空间推理基准数据集,相关论文成果为「OmniSpatial: Towards Comprehensive Spatial Reasoning Benchmark for Vision Language Models」,旨在填补视觉 – 语言模型空间理解评测的空白。

该数据集包含约 1,533 个图像 – 问答样本,涵盖动态推理(Dynamic Reasoning)、复杂空间逻辑(Complex Spatial Logic)、空间交互(Spatial Interaction)和视角转换(Perspective Taking)四大类空间推理任务,共计 50 个子任务。数据来源多样,涵盖互联网图像、心理学测试与驾驶考试题,标注经多轮审核,保证质量与多样性。与传统基准相比,OmniSpatial 避免了模板化构造,更贴近真实复杂场景,不仅测试基础空间关系(如前后、左右、远近),还强调多物体交互、场景变化和跨视角推理。

该数据集适用于训练与评测多模态大模型的空间推理能力,特别是在智能导航、增强/虚拟现实以及复杂场景理解等应用中,是一个全面而具有挑战性的标准化基准数据集。

OmniSpatial.torrent
做种 1正在下载 0已完成 5总下载次数 27
  • OmniSpatial/
    • README.md
      2.06 KB
    • README.txt
      4.12 KB
      • data/
        • OmniSpatial.zip
          9.45 GB

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供