HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données De Référence Pour La Génération d'images Multimodales T2I-CoReBench

Date

il y a 4 mois

Organisation

L'Université de Hong Kong
Université des sciences et technologies de Chine
Technologie Kuaishou

URL du document

2509.03516

Licence

Apache 2.0

T2I-CoReBench est un benchmark d'évaluation complet pour les modèles de génération d'images pilotés par texte proposé par l'Université des sciences et technologies de Chine, l'équipe Kuaishou Technology Kling et l'Université de Hong Kong en 2025. Les résultats pertinents de l'article sont "Peindre plus facilement que penser : les modèles texte-image peuvent-ils planter le décor, mais pas diriger la pièce ?", qui vise à mesurer simultanément la capacité de combinaison et la capacité de raisonnement des modèles de génération d'images.

L'ensemble de données contient 1 080 invites très stimulantes et est équipé d'environ 13 500 éléments d'inspection couvrant 12 dimensions, qui sont utilisés pour évaluer si chaque élément attendu dans l'image générée est correctement présenté.

Composition des données

Cet ensemble de données conçoit des invites et des systèmes d'évaluation à partir de deux dimensions :

  • Dimension de composition : créez différentes structures de composition autour de trois types d'éléments de graphe de scène : instance, attribut et relation.
  • Dimension du raisonnement : Basée sur trois types de raisonnement : déductif, inductif et abductif.

Pour faciliter une évaluation précise, chaque invite est accompagnée d’une liste de contrôle oui/non qui indique si chaque élément implicitement ou explicitement requis par l’invite est correctement présenté.

Graphique de distribution des données

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp