HyperAIHyperAI

Command Palette

Search for a command to run...

Konsole

EMMA-Benchmark-Datensatz Für Multimodales Denken

Datum

vor 7 Monaten

Größe

228.19 MB

Organisation

Microsoft
Universität von Washington
Sun Yat-sen-Universität

Paper-URL

arxiv.org

EMMA (Enhanced MultiModal reAsoning) ist ein Benchmark-Datensatz für multimodales Denken, der 2025 von Forschungsteams der University of Electronic Science and Technology of China, der Sun Yat-sen University, der University of Washington und von Microsoft veröffentlicht wurde. Die relevanten Ergebnisse der Studie sind:Können MLLMs multimodal argumentieren? EMMA: Ein verbesserter Benchmark für multimodales Denken", dessen Ziel darin besteht, eine standardisierte Testplattform zur Bewertung der komplexen Argumentationsfähigkeiten multimodaler Großmodelle (MLLMs) bereitzustellen.

Der Datensatz konzentriert sich auf multimodale Denkaufgaben in den Bereichen organische Chemie (42%), Mathematik (32%), Physik (6%) und Programmierung (20%). Es enthält 2.788 Fragen, von denen 1.796 neu erstellte Stichproben sind. Es unterstützt eine feingranulare Aufgabenteilung und zielt darauf ab, die gemeinsame Verstehensfähigkeit von Bildern und Texten zu fördern. Zu den Datenaufgabentypen gehören die Simulation chemischer Reaktionen, mathematisches Grafik-Argumentieren, physikalische Pfadverfolgung, Programmiervisualisierung usw.

Der Anteil der verschiedenen Disziplinen und ihrer Teilaufgaben im Datensatz

EMMA.torrent
Seeding 1Wird heruntergeladen 0Abgeschlossen 55Gesamte Downloads 168
  • EMMA/
    • README.md
      1.6 KB
    • README.txt
      3.21 KB
      • data/
        • EMMA.zip
          228.19 MB

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-Co-Programmierung
Einsatzbereite GPUs
Bestpreis

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp