@inproceedings{ zhu2026autofigure, title={AutoFigure: Generating and Refining Publication-Ready Scientific Illustrations}, author={Minjun Zhu and Zhen Lin and Yixuan Weng and Panzhong Lu and Qiujie Xie and Yifan Wei and Sifan Liu and Qiyao Sun and Yue Zhang}, booktitle={The Fourteenth International Conference on Learning Representations}, year={2026}, url={https://openreview.net/forum?id=5N3z9JQJKq} }

日期

1 个月前

数据集组织

论文 URL

2602.03828

许可证

CC BY 4.0

标签

FigureBench 是由西湖大学文本智能实验室于 2026 年发布的科学插图生成基准数据集，相关论文成果为 AutoFigure: Generating and Refining Publication-Ready Scientific Illustrations，旨在解决从长篇幅科学文本中自动生成高质量科学插图的任务，为自动科学插图生成研究提供了具有挑战性且多样化的测试平台。该数据集共包含 3,300 个样本，由开发集（Dev）和测试集（Test）组成，其中开发集采用对话格式标注，用于模型训练与开发；测试集采用纯文本与图像的简单配对格式，仅用于模型评估。

数据集构成

开发集（Dev）：包含 3,000 个样本，其中包含

2,900 篇研究论文
20 篇技术博客
40 篇综述文章
40 本教科书测试集（Test）：包含 300 个样本，其中包含
200 篇研究论文
20 篇技术博客
40 篇综述文章
40 本教科书

Citation

@inproceedings{
zhu2026autofigure,
title={AutoFigure: Generating and Refining Publication-Ready Scientific Illustrations},
author={Minjun Zhu and Zhen Lin and Yixuan Weng and Panzhong Lu and Qiujie Xie and Yifan Wei and Sifan Liu and Qiyao Sun and Yue Zhang},
booktitle={The Fourteenth International Conference on Learning Representations},
year={2026},
url={https://openreview.net/forum?id=5N3z9JQJKq}
}

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

Global Climate & Energy Transition 2000 – 2026 全球气候能源数据集

Command Palette

FigureBench 科学插图生成基准数据集

数据集构成

Citation

用 AI 构建 AI

HyperAI Newsletters

Command Palette

FigureBench 科学插图生成基准数据集

数据集构成

Citation

相关数据集

Global Climate & Energy Transition 2000 – 2026 全球气候能源数据集

Verbatim Spans 查询条件证据提取数据集

Nemotron-SFT-Math-v4 数学推理 SFT 数据集

TACK 靶向嵌合体知识库数据集

EAVSD 电商广告视频分镜数据集

SMOL 多语言翻译平行数据集

ViMU 视频隐喻理解数据集

MemLens 多模态长上下文基准数据集

VisCoR-55K 视觉推理数据集

MathNet 多模态数学基准推理数据集

Claw-Eval 真实世界评测基准数据集

Eye Disease Classification Fundus 眼底疾病分类数据集

Long-Distance Wildfire & Smoke Detection 长距离野火烟雾检测数据集

Medical Waste 医疗废弃物检测数据集

QCalEval 量子校准图表理解数据集

RSRCC 遥感区域变化理解基准数据集

PanScale 遥感全色锐化数据集

MIA 多步推理与决策轨迹数据集

OmniParsingBench 多模态解析能力评估数据集

MDPBench 多语言文档解析基准数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

FigureBench 科学插图生成基准数据集

数据集构成

Citation

相关数据集

Global Climate & Energy Transition 2000 – 2026 全球气候能源数据集

Verbatim Spans 查询条件证据提取数据集

Nemotron-SFT-Math-v4 数学推理 SFT 数据集

TACK 靶向嵌合体知识库数据集

EAVSD 电商广告视频分镜数据集

SMOL 多语言翻译平行数据集

ViMU 视频隐喻理解数据集

MemLens 多模态长上下文基准数据集

VisCoR-55K 视觉推理数据集

MathNet 多模态数学基准推理数据集

Claw-Eval 真实世界评测基准数据集

Eye Disease Classification Fundus 眼底疾病分类数据集

Long-Distance Wildfire & Smoke Detection 长距离野火烟雾检测数据集

Medical Waste 医疗废弃物检测数据集

QCalEval 量子校准图表理解数据集

RSRCC 遥感区域变化理解基准数据集

PanScale 遥感全色锐化数据集

MIA 多步推理与决策轨迹数据集

OmniParsingBench 多模态解析能力评估数据集

MDPBench 多语言文档解析基准数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

Global Climate & Energy Transition 2000 – 2026 全球气候能源数据集

Verbatim Spans 查询条件证据提取数据集

Nemotron-SFT-Math-v4 数学推理 SFT 数据集

TACK 靶向嵌合体知识库数据集

EAVSD 电商广告视频分镜数据集

SMOL 多语言翻译平行数据集

ViMU 视频隐喻理解数据集

MemLens 多模态长上下文基准数据集

VisCoR-55K 视觉推理数据集

MathNet 多模态数学基准推理数据集

Claw-Eval 真实世界评测基准数据集

Eye Disease Classification Fundus 眼底疾病分类数据集

Long-Distance Wildfire & Smoke Detection 长距离野火烟雾检测数据集

Medical Waste 医疗废弃物检测数据集

QCalEval 量子校准图表理解数据集

RSRCC 遥感区域变化理解基准数据集

PanScale 遥感全色锐化数据集

MIA 多步推理与决策轨迹数据集

OmniParsingBench 多模态解析能力评估数据集