HyperAIHyperAI

Command Palette

Search for a command to run...

QCalEval 量子校准图表理解数据集

日期

5 小时内

数据集组织

NVIDIA(英伟达)

许可证

CC BY 4.0

QCalEval 是由 NVIDIA 于 2026 年发布的一个面向量子计算实验图理解的视觉语言数据集,旨在评估视觉语言模型(VLM)对量子计算校准实验结果进行解释、分类和推理能力,广泛应用于视觉语言模型与科学图像理解研究,尤其用于量子计算自动化分析中的模型基准测试、科学图表解读能力评估、多模态情境学习研究,以及零样本与少样本条件下结构化科学任务性能对比。 该数据集包含 309 张 PNG 格式的二维科学图像,以及 243 个基准测试条目与 236 个少样本基准测试条目,整体覆盖 22 个实验系列并涉及 87 种场景类型。

数据构成

  • PNG 格式的二维科学图像(如散点图、折线图和热力图)
  • 基准测试条目:每条 6 个问答对,涉及视觉描述、结果分类、科学推理、拟合可靠性评估、参数提取和校准诊断 6 个方面,共 1,458 个 QA
  • 少样本测试条目:每条 3 个问答对,共 708 个 QA

Citation

@misc{cao2026qcaleval,
title = {QCalEval: Benchmarking Vision-Language Models for Quantum Calibration Plot Understanding},
author = {Cao, Shuxiang and Zhang, Zijian and others},
year = {2026},
url = {https://research.nvidia.com/publication/2026-04_qcaleval-benchmarking-vision-language-models-quantum-calibration-plot},
}

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供