Command Palette
Search for a command to run...
GGBench : Un benchmark de raisonnement génératif géométrique pour les modèles multimodaux unifiés
Jingxuan Wei Caijun Jia Xi Bai Xinglong Xu Siyuan Li Linzhuang Sun Bihui Yu Conghui He Lijun Wu Cheng Tan

Résumé
L’arrivée des modèles multimodaux unifiés (UMMs) marque un tournant paradigmatique dans le domaine de l’intelligence artificielle, passant d’une perception passive à une génération active et transmodale. Malgré leur capacité sans précédent à synthétiser des informations, un écart critique subsiste en matière d’évaluation : les benchmarks existants évaluent principalement soit la compréhension discriminative, soit la génération d’images non contrainte, sans mesurer le processus cognitif intégré de raisonnement génératif. Pour combler cette lacune, nous proposons que la construction géométrique constitue un terrain d’expérimentation idéal, car elle exige intrinsèquement une fusion entre la compréhension du langage et la génération visuelle précise. Nous introduisons GGBench, un benchmark spécifiquement conçu pour évaluer le raisonnement géométrique génératif. Il offre un cadre complet permettant d’analyser de manière systématique la capacité d’un modèle non seulement à comprendre et raisonner, mais aussi à construire activement une solution, établissant ainsi un standard plus rigoureux pour la prochaine génération de systèmes intelligents. Site du projet : https://opendatalab-raiser.github.io/GGBench/.
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.