HyperAIHyperAI

Command Palette

Search for a command to run...

COREVQA 视觉问答基准数据集

Date

4 个月前

Size

5.63 GB

Publish URL

www.kaggle.com

Paper URL

2507.13405

License

Apache 2.0

Tags

COREVQA 是由 Algoverse 人工智能研究中心于 2025 年发布的一个视觉问答基准数据集,相关论文成果为 「COREVQA: A Crowd Observation and Reasoning Entailment Visual Question Answering Benchmark」,旨在评估视觉语言模型(VLM)在 人群场景中的推理蕴含能力。

该数据集包含 5,608 对图像与真/假语句对,图像源自 CrowdHuman 数据集。数据以真实拥挤场景为主,强调遮挡、视角变化与背景干扰等难点,旨在推动 VLM 在复杂社会场景下的细粒度感知与推理能力。

数据包含:

  • 场景图像(image_id)
  • 自然语言陈述(question)
  • 二分类标签(answer:TRUE / FALSE)

COREVQA.torrent
Seeding 1Downloading 0Completed 19Total Downloads 109
  • COREVQA/
    • README.md
      1.42 KB
    • README.txt
      2.85 KB
      • data/
        • COREVQA.zip
          5.63 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供