Command Palette

Search for a command to run...

OmniSpatial パノラマ空間推論ベンチマークデータセット

日付

1ヶ月前

サイズ

9.45 GB

組織

上海氣志研究所
清華大学
上海人工知能研究所

論文URL

2506.03135

ライセンス

Apache 2.0

OmniSpatialは、清華大学、上海知能研究所、上海人工知能研究所などの機関によって2025年に公開されたパノラマ空間推論ベンチマークデータセットです。関連する論文の結果は次のとおりです。OmniSpatial: 視覚言語モデルのための包括的な空間推論ベンチマークに向けては、視覚言語モデル空間理解の評価におけるギャップを埋めることを目的としています。

このデータセットには、約1,533件の画像質問応答例が含まれており、空間推論タスクの4つの主要カテゴリ(動的推論、複雑な空間論理、空間相互作用、視点取得)と合計50のサブタスクを網羅しています。データは、インターネット画像、心理テスト、運転免許試験問題など、多様なソースから取得されています。アノテーションは、品質と多様性を確保するために複数回のレビューを経ています。従来のベンチマークと比較して、OmniSpatialはテンプレートベースの構築を避け、より現実的で複雑な構造となっています。前後、左右、遠近などの基本的な空間関係をテストするだけでなく、複数オブジェクトの相互作用、シーンの変化、視点間の推論にも重点を置いています。

このデータセットは、特にインテリジェントナビゲーション、拡張現実(AR)、仮想現実(VR)、複雑なシーン理解といったアプリケーションにおいて、大規模マルチモーダルモデルの空間推論能力の学習と評価に適しています。包括的かつ挑戦的な標準化ベンチマークデータセットです。

OmniSpatial.torrent
シーディング 2ダウンロード中 0ダウンロード完了 5総ダウンロード数 27
  • OmniSpatial/
    • README.md
      2.06 KB
    • README.txt
      4.12 KB
      • data/
        • OmniSpatial.zip
          9.45 GB

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
OmniSpatial パノラマ空間推論ベンチマークデータセット | データセット | HyperAI超神経