HyperAIHyperAI

Command Palette

Search for a command to run...

Console

GenExam Multidisziplinärer Benchmark-Datensatz Für Literarische Und Grafische Prüfungen

Date

vor 3 Monaten

Size

276.88 MB

Organization

Shanghai Jiao Tong Universität
Shanghaier Labor für künstliche Intelligenz
Tsinghua-Universität

Paper URL

2509.14232

License

MIT

GenExam ist der erste multidisziplinäre Text-zu-Bild-Benchmark-Datensatz im Prüfungsstil, der 2025 vom Shanghai Artificial Intelligence Laboratory, der Shanghai Jiao Tong University, der Tsinghua University und anderen Institutionen veröffentlicht wurde. Die zugehörigen Ergebnisse sind:GenExam: Eine multidisziplinäre Text-zu-Bild-Prüfung“, mit dem Ziel zu testen, ob das Modell Verständnis-, Argumentations- und Generierungsfähigkeiten integrieren kann, um Zeichenprobleme wirklich zu lösen.

Dieser Datensatz enthält rund 1.000 hochwertige Beispiele aus zehn Disziplinen: Mathematik, Physik, Chemie, Biologie, Informatik, Ingenieurwesen, Medizin, Kunst, Geographie und Geschichte. Jedes Beispiel enthält vielfältige und anspruchsvolle Aufgabenstellungen, entsprechende Ground-Truth-Bilder und eine detaillierte Punktevergabe, die den hohen Anforderungen und Schwierigkeitsgrad realer Prüfungen vollumfänglich Rechnung trägt. Der Datensatz wurde in vier Schritten erstellt: Ausgehend von rund 40.000 Bildern, die automatisch von GPT-5 geprüft und mit Aufgaben versehen und anschließend von promovierten Experten gründlich überprüft wurden, entstanden schließlich die oben genannten 1.000 multidisziplinären Beispiele.

Dataset-Beispiel

GenExam.torrent
Seeding 2Downloading 1Completed 9Total Downloads 69
  • GenExam/
    • README.md
      1.83 KB
    • README.txt
      3.65 KB
      • data/
        • GenExam.zip
          276.88 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp