Command Palette
Search for a command to run...
FigureBench 科学插图生成基准数据集
FigureBench 是由西湖大学文本智能实验室于 2026 年发布的科学插图生成基准数据集,相关论文成果为 AutoFigure: Generating and Refining Publication-Ready Scientific Illustrations,旨在解决从长篇幅科学文本中自动生成高质量科学插图的任务,为自动科学插图生成研究提供了具有挑战性且多样化的测试平台。 该数据集共包含 3,300 个样本,由开发集(Dev)和测试集(Test)组成,其中开发集采用对话格式标注,用于模型训练与开发;测试集采用纯文本与图像的简单配对格式,仅用于模型评估。
数据集构成
开发集(Dev):包含 3,000 个样本,其中包含
- 2,900 篇研究论文
- 20 篇技术博客
- 40 篇综述文章
- 40 本教科书 测试集(Test):包含 300 个样本,其中包含
- 200 篇研究论文
- 20 篇技术博客
- 40 篇综述文章
- 40 本教科书
Citation
@inproceedings{
zhu2026autofigure,
title={AutoFigure: Generating and Refining Publication-Ready Scientific Illustrations},
author={Minjun Zhu and Zhen Lin and Yixuan Weng and Panzhong Lu and Qiujie Xie and Yifan Wei and Sifan Liu and Qiyao Sun and Yue Zhang},
booktitle={The Fourteenth International Conference on Learning Representations},
year={2026},
url={https://openreview.net/forum?id=5N3z9JQJKq}
}