日期

8 个月前

大小

65.85 GB

数据集组织

许可证

MIT

标签

图像理解

FineReason 是由 OpenDataArena 于 2025 年发布的一个面向大型多模态模型（LMMs）视觉推理能力训练与评测的数据集，旨在提升模型在视觉谜题、游戏、复杂图表推理、 STEM（科学，技术，工程和数学）知识应用等场景中的可解释、可检验的长链条推理能力。该数据集覆盖几何题（geometry3k / geo170k）、图示与流程图理解（AI2D）、视觉推理及观察类谜题（visualwebinstruct 等）等多种任务类型。所有样本均采用统一数据格式，包含唯一编号、问题文本、对应图像以及推理式答案。数据集由多个公开子集整合而成，并通过 Qwen3-VL-235B-a22B-thinking 模型进行推理链条蒸馏，使样本均具备结构清晰、可检验的逐步推理过程及最终解答。

数据构成（持续扩展中）：

BMMR：42,647 条
Euclid30K：27,111 条
ai2d_merged：2,446 条
geo170k（问答）：12,101 条
geometry3k / mathv360k：9,724 条
ScienceQA：6,146 条
TQA（TextbookQA）：12,565 条
VisualWebInstruct（过滤后）：261,436 条
MMR1：1,000 条
VisualSphinx：3,781 条
MMOpenR1-8K：7,428 条

Citation

@misc{lin2026mmfinereasonclosingmultimodalreasoning, title={MMFineReason: Closing the Multimodal Reasoning Gap via Open Data-Centric Methods}, author={Honglin Lin and Zheng Liu and Yun Zhu and Chonghan Qin and Juekai Lin and Xiaoran Shang and Conghui He and Wentao Zhang and Lijun Wu}, year={2026}, eprint={2601.21821}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2601.21821}, }

FineReason.torrent

做种 1正在下载 0已完成 3总下载量 137

FineReason/
- README.md
  1.9 KB
- README.txt
  3.8 KB

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

使用此数据集

在 Discord 上讨论

日期

8 个月前

大小

65.85 GB

数据集组织

许可证

MIT

标签

图像理解

数据构成（持续扩展中）：

BMMR：42,647 条
Euclid30K：27,111 条
ai2d_merged：2,446 条
geo170k（问答）：12,101 条
geometry3k / mathv360k：9,724 条
ScienceQA：6,146 条
TQA（TextbookQA）：12,565 条
VisualWebInstruct（过滤后）：261,436 条
MMR1：1,000 条
VisualSphinx：3,781 条
MMOpenR1-8K：7,428 条

Citation

FineReason.torrent

做种 1正在下载 0已完成 3总下载量 137

FineReason/
- README.md
  1.9 KB
- README.txt
  3.8 KB

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

SAM 3D Artist Objects 3D 物体重建数据集

1 小时内

FigureBench 科学插图生成基准数据集

12 分钟前

RSRCC 遥感区域变化理解基准数据集

1 天前

MDPBench 多语言文档解析基准数据集

1 天前

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

数据构成（持续扩展中）：

Citation

用 AI 构建 AI

HyperAI Newsletters

数据构成（持续扩展中）：

Citation

相关数据集

SAM 3D Artist Objects 3D 物体重建数据集

FigureBench 科学插图生成基准数据集

RSRCC 遥感区域变化理解基准数据集

MDPBench 多语言文档解析基准数据集

用 AI 构建 AI

HyperAI Newsletters

数据构成（持续扩展中）：

Citation

相关数据集

SAM 3D Artist Objects 3D 物体重建数据集

FigureBench 科学插图生成基准数据集

RSRCC 遥感区域变化理解基准数据集

MDPBench 多语言文档解析基准数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

SAM 3D Artist Objects 3D 物体重建数据集

FigureBench 科学插图生成基准数据集

RSRCC 遥感区域变化理解基准数据集

MDPBench 多语言文档解析基准数据集

相关数据集

SAM 3D Artist Objects 3D 物体重建数据集

FigureBench 科学插图生成基准数据集

RSRCC 遥感区域变化理解基准数据集

MDPBench 多语言文档解析基准数据集

Command Palette

FineReason 多模态视觉推理数据集

数据构成（持续扩展中）：

Citation

用 AI 构建 AI

HyperAI Newsletters

Command Palette

FineReason 多模态视觉推理数据集

数据构成（持续扩展中）：

Citation

相关数据集

SAM 3D Artist Objects 3D 物体重建数据集

FigureBench 科学插图生成基准数据集

RSRCC 遥感区域变化理解基准数据集

MDPBench 多语言文档解析基准数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

FineReason 多模态视觉推理数据集

数据构成（持续扩展中）：

Citation

相关数据集

SAM 3D Artist Objects 3D 物体重建数据集

FigureBench 科学插图生成基准数据集

RSRCC 遥感区域变化理解基准数据集

MDPBench 多语言文档解析基准数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

SAM 3D Artist Objects 3D 物体重建数据集

FigureBench 科学插图生成基准数据集

RSRCC 遥感区域变化理解基准数据集

MDPBench 多语言文档解析基准数据集

相关数据集

SAM 3D Artist Objects 3D 物体重建数据集

FigureBench 科学插图生成基准数据集

RSRCC 遥感区域变化理解基准数据集

MDPBench 多语言文档解析基准数据集