Command Palette

Search for a command to run...

VCBench 数学的推論ベンチマークデータセット

日付

5ヶ月前

サイズ

86.04 MB

組織

浙江大学

論文URL

arxiv.org

VCBench は、明示的な視覚的依存性を持つマルチモーダル数学的推論を評価するためのベンチマーク データセットであり、2025 年に Alibaba と浙江大学によってリリースされました。データセットには、1,720 の質問と回答のペアと合計 6,697 枚の画像が含まれています。

質問は主に以下の6つの分野に及びます。

  • 時間とカレンダー: 2 つのサブカテゴリ (カレンダーと時計) にわたって時間に関する推論問題をテストします。時間間隔とカレンダーに基づく計算についての理解が必要です。
  • 空間と位置: 課題は、3 つのサブカテゴリ (方向、位置、場所) での空間的推論に焦点を当て、相対的な位置、方向、空間関係の理解を評価します。
  • 幾何学と図形: 5 つのサブカテゴリ (角度、四辺形、長方形、図形、三角形) をカバーする質問は、基本的な図形の認識からより複雑な特性の分析まで、基本的な幾何学の理解をテストします。
  • オブジェクトとモーション: 3 次元オブジェクトとモーション変換の理解を評価する 2 つのサブカテゴリ (Cube と Move) のタスク。
  • 推論と観察: 両方のサブカテゴリ (推論と観察) の質問は、論理的推論と注意深い視覚観察スキルをテストするように設計されています。
  • 組織とパターン: 3 つのサブカテゴリ (組織、パターン、重み) にわたる課題で、パターン認識、順序付け、組織ロジックを評価します。
データセットの質問タイプ
VCBench.torrent
シーディング 1ダウンロード中 0ダウンロード完了 43総ダウンロード数 114
  • VCBench/
    • README.md
      1.89 KB
    • README.txt
      3.78 KB
      • data/
        • VCBench.zip
          86.04 MB

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
VCBench 数学的推論ベンチマークデータセット | データセット | HyperAI超神経