Command Palette
Search for a command to run...
Ensemble De Données De Compréhension d'images De Scène VisualOverload
VisualOverload est un ensemble de données d'évaluation de la compréhension d'images de scène qui vise à examiner la compréhension visuelle du modèle et sa capacité de raisonnement des détails dans des scènes complexes sans s'appuyer sur des connaissances externes.
Cet ensemble de données contient 2 720 paires de questions-réponses, composées de peintures haute résolution, du domaine public, présentant souvent de multiples personnages, actions, intrigues secondaires et arrière-plans complexes. Les questions sont conçues manuellement pour tester de manière exhaustive la compréhension de la scène par le modèle. Cet ensemble de données est adapté à la recherche par questions-réponses visuelles, à la compréhension et au raisonnement détaillés d'images, ainsi qu'à l'évaluation de scènes complexes comportant de multiples personnages et éléments.

Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.