VisualOverload シーン画像理解データセット

日付

15日前

サイズ

601.3 MB

ライセンス

CC BY-SA 4.0

VisualOverload は、外部の知識に依存せずに複雑なシーンの詳細に対するモデルの視覚的理解と推論能力を調べることを目的としたシーン画像理解評価データセットです。

このデータセットには、パブリックドメインの高解像度絵画から構成される2,720組の質問と回答のペアが含まれており、複数の登場人物、行動、サブプロット、複雑な背景が描かれていることが多いです。質問は手動で設計されており、モデルのシーン理解能力を包括的にテストします。このデータセットは、視覚的な質問応答の研究、詳細な画像の理解と推論、そして複数の登場人物や要素を含む複雑なシーンの評価に適しています。

データセットの例
ビジュアルオーバーロード.torrent
シーディング 1ダウンロード中 0ダウンロード完了 1総ダウンロード数 10
  • VisualOverload/
    • README.md
      1.31 KB
    • README.txt
      2.62 KB
      • data/
        • VisualOverload.zip
          601.3 MB