IF-Bench 红外图像理解基准数据集
IF-Bench 是由中国科学院自动化研究所联合中国科学院大学人工智能学院于 2025 年发布的一个面向红外图像多模态理解的高质量评测基准,相关论文成果为 IF-Bench: Benchmarking and Enhancing MLLMs for Infrared Images with Generative Visual Prompting,旨在系统评估多模态大语言模型(MLLMs)对红外图像的语义理解能力。
该数据集包含 499 张红外图像和 680 组视觉问答(VQA)对,图像来源于 23 个不同的红外图像数据集,整体分布保持相对均衡。数据集围绕红外图像理解任务构建,覆盖 10 个关键图像理解维度。所有问题均提供中英文双语版本,选项顺序随机打乱,确保正确答案在 A–D 选项中均匀分布。
