VSI-Bench 視覚空間知能ベンチマーク テスト セット
VSI-Bench (正式名: Visual-Spatial Intelligence Benchmark) は、Li Feifei、Xie Saining、および彼らの研究チームによって 2024 年に開始された視覚空間知能ベンチマーク テスト セットです。マルチモーダル大規模言語のパフォーマンスを評価することを目的としています。空間認知と理解能力におけるモデル (MLLM)、関連する論文の結果は次のとおりです。空間で考える: マルチモーダル大規模言語モデルが空間をどのように見て、記憶し、呼び出すか”。このデータ セットには 5,000 を超える質問と回答のペアが含まれており、住宅、オフィス、工場などのさまざまな環境を含む 290 近くの実際の屋内シーンのビデオをカバーし、物体認識、位置関係、行動予測などの多くの側面をカバーしています。この多様なデータ構造は、より堅牢なモデルのトレーニングに役立つだけでなく、アルゴリズムの検証と最適化のための豊富なリソースを開発者に提供します。

VSI-Bench.torrent
シーディング 1ダウンロード中 1ダウンロード完了 43総ダウンロード数 50