HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 9 jours

GGBench : Un benchmark de raisonnement génératif géométrique pour les modèles multimodaux unifiés

Jingxuan Wei Caijun Jia Xi Bai Xinglong Xu Siyuan Li Linzhuang Sun Bihui Yu Conghui He Lijun Wu Cheng Tan

GGBench : Un benchmark de raisonnement génératif géométrique pour les modèles multimodaux unifiés

Résumé

L’arrivée des modèles multimodaux unifiés (UMMs) marque un tournant paradigmatique dans le domaine de l’intelligence artificielle, passant d’une perception passive à une génération active et transmodale. Malgré leur capacité sans précédent à synthétiser des informations, un écart critique subsiste en matière d’évaluation : les benchmarks existants évaluent principalement soit la compréhension discriminative, soit la génération d’images non contrainte, sans mesurer le processus cognitif intégré de raisonnement génératif. Pour combler cette lacune, nous proposons que la construction géométrique constitue un terrain d’expérimentation idéal, car elle exige intrinsèquement une fusion entre la compréhension du langage et la génération visuelle précise. Nous introduisons GGBench, un benchmark spécifiquement conçu pour évaluer le raisonnement géométrique génératif. Il offre un cadre complet permettant d’analyser de manière systématique la capacité d’un modèle non seulement à comprendre et raisonner, mais aussi à construire activement une solution, établissant ainsi un standard plus rigoureux pour la prochaine génération de systèmes intelligents. Site du projet : https://opendatalab-raiser.github.io/GGBench/.

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
GGBench : Un benchmark de raisonnement génératif géométrique pour les modèles multimodaux unifiés | Articles de recherche | HyperAI