Command Palette

Search for a command to run...

VCBench 数学推理基准数据集

日期

5 个月前

大小

86.04 MB

机构

浙江大学

论文链接

arxiv.org

VCBench 是由阿里巴巴联合浙江大学,于 2025 年发布的一个专为评估具备显式视觉依赖性的多模态数学推理基准数据集。该数据集包含 1,720 个问答对,共包含 6,697 张图片。

问题主要包含以下 6 个领域:

  • 时间和日历:测试两个子类别(日历和时钟)的时间推理问题,需要理解时间间隔和基于日历的计算。
  • 空间和位置:挑战集中在三个子类别(方向、位置和地点)的空间推理上,以评估对相对位置、方向和空间关系的理解。
  • 几何和形状:涵盖五个子类别(角度、四边形、矩形、形状和三角形)的问题,测试从基本形状识别到更复杂的属性分析的基本几何理解能力。
  • 物体和运动:两个子类别(立方体和移动)中的任务,用于评估对三维物体和运动变换的理解。
  • 推理和观察:两个子类别(推理和观察)中的问题旨在测试逻辑推理和仔细的视觉观察技能。
  • 组织和模式:跨三个子类别(组织、模式和权重)的挑战,评估模式识别、排序和组织逻辑。
数据集问题类型
VCBench.torrent
做种 1正在下载 0已完成 43总下载次数 114
  • VCBench/
    • README.md
      1.89 KB
    • README.txt
      3.78 KB
      • data/
        • VCBench.zip
          86.04 MB

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供