HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données De Référence COREVQA Pour Les Questions Visuelles

Date

il y a 6 mois

Taille

5.63 GB

URL de publication

www.kaggle.com

URL du document

2507.13405

Licence

Apache 2.0

Balises

COREVQA est un ensemble de données de référence de réponses visuelles aux questions publié par l'Algoverse Artificial Intelligence Research Center en 2025. Les résultats de l'article associé sont « COREVQA : une évaluation comparative des questions visuelles et de l'implication du raisonnement et de l'observation des foules », qui vise à évaluer la capacité d'implication du raisonnement des modèles de langage visuel (VLM) dans les scènes de foule.

Cet ensemble de données contient 5 608 paires d'images et de phrases vrai/faux. Ces images sont issues de l'ensemble de données CrowdHuman. Elles représentent principalement des scènes réelles de foule, mettant l'accent sur des problèmes tels que l'occlusion, les changements de perspective et les interférences d'arrière-plan. Elles visent à améliorer les capacités de perception et de raisonnement précis des VLM dans des situations sociales complexes.

Les données comprennent :

  • Image de la scène (image_id)
  • Énoncé en langage naturel (question)
  • Étiquette binaire (réponse : VRAI / FAUX)

COREVQA.torrent
Seeding 1Téléchargement 0Terminé 32Total Downloads 124
  • COREVQA/
    • README.md
      1.42 KB
    • README.txt
      2.85 KB
      • data/
        • COREVQA.zip
          5.63 GB

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp