Command Palette
Search for a command to run...
OmniSpatial パノラマ空間推論ベンチマークデータセット
OmniSpatialは、清華大学、上海知能研究所、上海人工知能研究所などの機関によって2025年に公開されたパノラマ空間推論ベンチマークデータセットです。関連する論文の結果は次のとおりです。OmniSpatial: 視覚言語モデルのための包括的な空間推論ベンチマークに向けては、視覚言語モデル空間理解の評価におけるギャップを埋めることを目的としています。
このデータセットには、約1,533件の画像質問応答例が含まれており、空間推論タスクの4つの主要カテゴリ(動的推論、複雑な空間論理、空間相互作用、視点取得)と合計50のサブタスクを網羅しています。データは、インターネット画像、心理テスト、運転免許試験問題など、多様なソースから取得されています。アノテーションは、品質と多様性を確保するために複数回のレビューを経ています。従来のベンチマークと比較して、OmniSpatialはテンプレートベースの構築を避け、より現実的で複雑な構造となっています。前後、左右、遠近などの基本的な空間関係をテストするだけでなく、複数オブジェクトの相互作用、シーンの変化、視点間の推論にも重点を置いています。
このデータセットは、特にインテリジェントナビゲーション、拡張現実(AR)、仮想現実(VR)、複雑なシーン理解といったアプリケーションにおいて、大規模マルチモーダルモデルの空間推論能力の学習と評価に適しています。包括的かつ挑戦的な標準化ベンチマークデータセットです。
OmniSpatial.torrent
シーディング 2ダウンロード中 0ダウンロード完了 5総ダウンロード数 27