HyperAIHyperAI

Command Palette

Search for a command to run...

VCBench 数学推理基准数据集

Date

6 个月前

Size

86.04 MB

Organization

浙江大学

Paper URL

arxiv.org

VCBench 是由阿里巴巴联合浙江大学,于 2025 年发布的一个专为评估具备显式视觉依赖性的多模态数学推理基准数据集。该数据集包含 1,720 个问答对,共包含 6,697 张图片。

问题主要包含以下 6 个领域:

  • 时间和日历:测试两个子类别(日历和时钟)的时间推理问题,需要理解时间间隔和基于日历的计算。
  • 空间和位置:挑战集中在三个子类别(方向、位置和地点)的空间推理上,以评估对相对位置、方向和空间关系的理解。
  • 几何和形状:涵盖五个子类别(角度、四边形、矩形、形状和三角形)的问题,测试从基本形状识别到更复杂的属性分析的基本几何理解能力。
  • 物体和运动:两个子类别(立方体和移动)中的任务,用于评估对三维物体和运动变换的理解。
  • 推理和观察:两个子类别(推理和观察)中的问题旨在测试逻辑推理和仔细的视觉观察技能。
  • 组织和模式:跨三个子类别(组织、模式和权重)的挑战,评估模式识别、排序和组织逻辑。
数据集问题类型
VCBench.torrent
Seeding 1Downloading 0Completed 45Total Downloads 140
  • VCBench/
    • README.md
      1.89 KB
    • README.txt
      3.78 KB
      • data/
        • VCBench.zip
          86.04 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供