日期

6 个月前

数据集组织

论文 URL

2512.09663

许可证

Apache 2.0

标签

IF-Bench 是由中国科学院自动化研究所联合中国科学院大学人工智能学院于 2025 年发布的一个面向红外图像多模态理解的高质量评测基准，相关论文成果为 IF-Bench: Benchmarking and Enhancing MLLMs for Infrared Images with Generative Visual Prompting，旨在系统评估多模态大语言模型（MLLMs）对红外图像的语义理解能力。该数据集包含 499 张红外图像和 680 组视觉问答（VQA）对，图像来源于 23 个不同的红外图像数据集，整体分布保持相对均衡。数据集围绕红外图像理解任务构建，覆盖 10 个关键图像理解维度。所有问题均提供中英文双语版本，选项顺序随机打乱，确保正确答案在 A–D 选项中均匀分布。

Citation

@misc{zhang2025ifbench, title={{IF-Bench}: Benchmarking and Enhancing MLLMs for Infrared Images with Generative Visual Prompting}, author={Tao Zhang and Yuyang Hong and Yang Xia and Kun Ding and Zeyu Zhang and Ying Wang and Shiming Xiang and Chunhong Pan}, journal={arXiv preprint arXiv:2512.09663}, year={2025} }

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。