Command Palette
Search for a command to run...
FineReason マルチモーダル視覚推論データセット
FineReasonは、OpenDataArenaが2025年に公開したデータセットで、大規模マルチモーダルモデル(LMM)の視覚推論能力の訓練と評価を目的としています。ビジュアルパズル、ゲーム、複雑なグラフ推論、STEM(科学、技術、工学、数学)知識応用といったシナリオにおいて、モデルの解釈可能かつ検証可能な長鎖推論能力を向上させることを目的としています。
このデータセットは、幾何学問題(geometry3k / geo170k)、図とフローチャートの理解(AI2D)、視覚的推論と観察パズル(visualwebinstructなど)など、様々なタスクタイプを網羅しています。すべてのサンプルは、一意のID、問題文、対応する画像、推論に基づく回答を含む統一されたデータ形式を使用しています。このデータセットは複数の公開サブセットからコンパイルされており、その推論チェーンはQwen3-VL-235B-a22B-thinkingモデルを用いて抽出されているため、すべてのサンプルにおいて明確に構造化され、検証可能な段階的な推論プロセスと最終的な解答が保証されています。
データ構成(随時拡大中)
- BMMR: 42,647 エントリ
- Euclid30K: 27,111 エントリ
- ai2d_merged: 2,446 エントリ
- geo170k (Q&A): 12,101件の結果
- geometry3k / mathv360k: 9,724件の結果
- ScienceQA: 6,146件の結果
- TQA(教科書QA):12,565項目
- VisualWebInstruct (フィルター済み): 261,436 件の結果
- MMR1: 1,000個
- VisualSphinx: 3,781件の結果
- MMOpenR1-8K: 7,428 エントリー