HyperAI
Command Palette
Search for a command to run...
QCalEval 量子校准图表理解数据集
QCalEval 是由 NVIDIA 于 2026 年发布的一个面向量子计算实验图理解的视觉语言数据集,旨在评估视觉语言模型(VLM)对量子计算校准实验结果进行解释、分类和推理能力,广泛应用于视觉语言模型与科学图像理解研究,尤其用于量子计算自动化分析中的模型基准测试、科学图表解读能力评估、多模态情境学习研究,以及零样本与少样本条件下结构化科学任务性能对比。 该数据集包含 309 张 PNG 格式的二维科学图像,以及 243 个基准测试条目与 236 个少样本基准测试条目,整体覆盖 22 个实验系列并涉及 87 种场景类型。
数据构成
- PNG 格式的二维科学图像(如散点图、折线图和热力图)
- 基准测试条目:每条 6 个问答对,涉及视觉描述、结果分类、科学推理、拟合可靠性评估、参数提取和校准诊断 6 个方面,共 1,458 个 QA
- 少样本测试条目:每条 3 个问答对,共 708 个 QA
Citation
@misc{cao2026qcaleval,
title = {QCalEval: Benchmarking Vision-Language Models for Quantum Calibration Plot Understanding},
author = {Cao, Shuxiang and Zhang, Zijian and others},
year = {2026},
url = {https://research.nvidia.com/publication/2026-04_qcaleval-benchmarking-vision-language-models-quantum-calibration-plot},
}
此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。