HyperAIHyperAI

Ensemble De Données De Compréhension d'images De Scène VisualOverload

VisualOverload est un ensemble de données d'évaluation de la compréhension d'images de scène qui vise à examiner la compréhension visuelle du modèle et sa capacité de raisonnement des détails dans des scènes complexes sans s'appuyer sur des connaissances externes.

Cet ensemble de données contient 2 720 paires de questions-réponses, composées de peintures haute résolution, du domaine public, présentant souvent de multiples personnages, actions, intrigues secondaires et arrière-plans complexes. Les questions sont conçues manuellement pour tester de manière exhaustive la compréhension de la scène par le modèle. Cet ensemble de données est adapté à la recherche par questions-réponses visuelles, à la compréhension et au raisonnement détaillés d'images, ainsi qu'à l'évaluation de scènes complexes comportant de multiples personnages et éléments.

Exemple d'ensemble de données
Surcharge visuelle.torrent
Partage 1Téléchargement 0Terminés 1Téléchargements totaux 11
  • VisualOverload/
    • README.md
      1.31 KB
    • README.txt
      2.62 KB
      • data/
        • VisualOverload.zip
          601.3 MB