Command Palette

Search for a command to run...

FineReason 多模态视觉推理数据集

日期

11 小时前

机构

OpenDataArena

许可协议

MIT

加入 Discord 社区

FineReason 是由 OpenDataArena 于 2025 年发布的一个面向大型多模态模型(LMMs)视觉推理能力训练与评测的数据集,旨在提升模型在视觉谜题、游戏、复杂图表推理、 STEM(科学,技术,工程和数学)知识应用等场景中的可解释、可检验的长链条推理能力。

该数据集覆盖几何题(geometry3k / geo170k)、图示与流程图理解(AI2D)、视觉推理及观察类谜题(visualwebinstruct 等)等多种任务类型。所有样本均采用统一数据格式,包含唯一编号、问题文本、对应图像以及推理式答案。数据集由多个公开子集整合而成,并通过 Qwen3-VL-235B-a22B-thinking 模型进行推理链条蒸馏,使样本均具备结构清晰、可检验的逐步推理过程及最终解答。

数据构成(持续扩展中):

  • BMMR:42,647 条
  • Euclid30K:27,111 条
  • ai2d_merged:2,446 条
  • geo170k(问答):12,101 条
  • geometry3k / mathv360k:9,724 条
  • ScienceQA:6,146 条
  • TQA(TextbookQA):12,565 条
  • VisualWebInstruct(过滤后):261,436 条
  • MMR1:1,000 条
  • VisualSphinx:3,781 条
  • MMOpenR1-8K:7,428 条

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
FineReason 多模态视觉推理数据集 | 数据集 | HyperAI超神经