Ensemble De Données De Référence Pour l'examen Littéraire Et Graphique Multidisciplinaire GenExam
Date
Size
Paper URL
License
MIT
GenExam est le premier ensemble de données de référence multidisciplinaires de type examen texte-image, publié en 2025 par le Laboratoire d'intelligence artificielle de Shanghai, l'Université Jiao Tong de Shanghai, l'Université Tsinghua et d'autres institutions. Les résultats de l'étude sont les suivants :GenExam : un examen multidisciplinaire de conversion de texte en image", qui vise à tester si le modèle peut intégrer des capacités de compréhension, de raisonnement et de génération pour résoudre véritablement les problèmes de dessin.
Cet ensemble de données contient environ 1 000 exemples de haute qualité répartis dans 10 disciplines : mathématiques, physique, chimie, biologie, informatique, ingénierie, médecine, art, géographie et histoire. Chaque exemple comprend des sujets variés et stimulants, des images de référence correspondantes et une notation précise, reflétant pleinement la rigueur et la difficulté des examens réels. L’ensemble de données a été construit en quatre étapes : d’abord avec environ 40 000 images, automatiquement filtrées et suggérées par GPT-5, puis rigoureusement revues par des experts de niveau doctorat, pour aboutir aux 1 000 exemples multidisciplinaires mentionnés ci-dessus.

Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.