Command Palette

Search for a command to run...

FineReason マルチモーダル視覚推論データセット

日付

13時間前

組織

オープンデータアリーナ

ライセンス

MIT

Discordコミュニティに参加

FineReasonは、OpenDataArenaが2025年に公開したデータセットで、大規模マルチモーダルモデル(LMM)の視覚推論能力の訓練と評価を目的としています。ビジュアルパズル、ゲーム、複雑なグラフ推論、STEM(科学、技術、工学、数学)知識応用といったシナリオにおいて、モデルの解釈可能かつ検証可能な長鎖推論能力を向上させることを目的としています。

このデータセットは、幾何学問題(geometry3k / geo170k)、図とフローチャートの理解(AI2D)、視覚的推論と観察パズル(visualwebinstructなど)など、様々なタスクタイプを網羅しています。すべてのサンプルは、一意のID、問題文、対応する画像、推論に基づく回答を含む統一されたデータ形式を使用しています。このデータセットは複数の公開サブセットからコンパイルされており、その推論チェーンはQwen3-VL-235B-a22B-thinkingモデルを用いて抽出されているため、すべてのサンプルにおいて明確に構造化され、検証可能な段階的な推論プロセスと最終的な解答が保証されています。

データ構成(随時拡大中)

  • BMMR: 42,647 エントリ
  • Euclid30K: 27,111 エントリ
  • ai2d_merged: 2,446 エントリ
  • geo170k (Q&A): 12,101件の結果
  • geometry3k / mathv360k: 9,724件の結果
  • ScienceQA: 6,146件の結果
  • TQA(教科書QA):12,565項目
  • VisualWebInstruct (フィルター済み): 261,436 件の結果
  • MMR1: 1,000個
  • VisualSphinx: 3,781件の結果
  • MMOpenR1-8K: 7,428 エントリー

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています